标准号:T/SAIAS 0013.3-2023
标准名称:教育通用人工智能大模型 第3部分:数据规范
团体名称:上海市人工智能行业协会
发布日期:2023年07月08日
实施日期:2023年08月08日
本文件规定了教育通用人工智能大模型数据集的构建原则、分类框架和基本模式结构;适用于教育通用人工智能大模型数据集的构建与管理。涉及数据集构建原则、数据分类与数据集、元数据结构等方面。
1.数据集构建原则包括学习内容的多样性、学习任务的多元化、学生群体的多样性、标注的准确性、教育领域的专业性、学习过程的动态性、数据集的质量、数据隐私和保护以及数据集的可用性和共享。
2.数据分类框架包括基础类数据、状态类数据、资源类数据、人员类数据和多模态数据。
3.元数据结构涉及元数据分类、数据元素、列表项、词汇表、最低峰值、字符集、表示,元数据分类内含基本模式结构、多语言字符串、持续时间、词汇表及编码等。
起草人:吴永和、申丽萍、吴战杰、李青、王士进、贺樑、杜婧、张军城、吴砥、卢海燕、冯翔、钟俊浩、应振宇、俞凯、王亚飞、许秋璇、颜欢、郑浩、陈曦、吴慧娜、钱雨、陈圆圆、吴欣怡、詹雪菲、吴优、李晶晶、沙燕霖、樊帅、朱苏、陈露、钱芳、田密、刘子韬、王龙飞、杨松涛、姚萌、黄瑾、王琳、王旭文、郑平平、程罡、贺媛婧、张欢、陈旭、王运武、陈业明、张然、胡时伟、胡廷锋、李春晖、何朝帆、兰焜耀、李欢冬