Score: 2

Conversational Education at Scale: A Multi-LLM Agent Workflow for Procedural Learning and Pedagogic Quality Assessment

Published: July 7, 2025 | arXiv ID: 2507.05528v2

By: Jiahuan Pei , Fanghua Ye , Xin Sun and more

Potential Business Impact:

Teaches computers to be good online tutors.

Business Areas:

Natural Language Processing Artificial Intelligence, Data and Analytics, Software

Large language models (LLMs) have advanced virtual educators and learners, bridging NLP with AI4Education. Existing work often lacks scalability and fails to leverage diverse, large-scale course content, with limited frameworks for assessing pedagogic quality. To this end, we propose WikiHowAgent, a multi-agent workflow leveraging LLMs to simulate interactive teaching-learning conversations. It integrates teacher and learner agents, an interaction manager, and an evaluator to facilitate procedural learning and assess pedagogic quality. We introduce a dataset of 114,296 teacher-learner conversations grounded in 14,287 tutorials across 17 domains and 727 topics. Our evaluation protocol combines computational and rubric-based metrics with human judgment alignment. Results demonstrate the workflow's effectiveness in diverse setups, offering insights into LLM capabilities across domains. Our datasets and implementations are fully open-sourced.

EducationQ: Evaluating LLMs' Teaching Capabilities Through Multi-Agent Dialogue Framework

Artificial Intelligence

Tests how well AI teaches students.

21 Apr 2025 1

91%

LLM Agents for Education: Advances and Applications

Computers and Society

Helps AI teach students and teachers better.

14 Mar 2025 1

91%

Enabling Multi-Agent Systems as Learning Designers: Applying Learning Sciences to AI Instructional Design

Computers and Society

Helps teachers make better school lessons.

20 Aug 2025 0

View PDF Login to Bookmark

Country of Origin

🇳🇱 🇨🇳 China, Netherlands

Repos / Data Links

github.com

Page Count

14 pages

Conversational Education at Scale: A Multi-LLM Agent Workflow for Procedural Learning and Pedagogic Quality Assessment

Teaches computers to be good online tutors.

Technical Abstract

EducationQ: Evaluating LLMs' Teaching Capabilities Through Multi-Agent Dialogue Framework

LLM Agents for Education: Advances and Applications

Enabling Multi-Agent Systems as Learning Designers: Applying Learning Sciences to AI Instructional Design