标准号:T/SAIAS 031-2025
标准名称:科学智能语料库建设导则
团体名称:上海市人工智能行业协会
发布日期:2025年07月24日
实施日期:2025年07月25日
本标准提供科学智能语料库建设技术指导,涵盖科学智能数据分类、范围、来源、元数据、存储格式及要求,数据采集、清洗、标注、通用测试与学科特色测试、使用科研大模型等流程,数据安全要求,及多学科语料特点示例,适用于其研究、开发、维护、应用、评估等工作。
起草单位:上海库帕思科技有限公司、上海市人工智能行业协会、上海科学智能研究院、上海人工智能实验室、上海创智学院、上海算法创新研究院大模型中心、北京深势科技有限公司、鸿之微科技(上海)股份有限公司、上海商汤智能科技有限公司、联通(上海)产业互联网有限公司、中国电信股份有限公司上海分公司、联通数据智能有限公司、上海宝信软件股份有限公司、上海工业自动化仪表研究院有限公司、国创智造科技(上海)有限公司、上海阶跃星辰智能科技有限公司、东华大学、上海岩芯数智人工智能科技有限公司、国家管网集团储能技术有限公司、国家工业信息安全发展研究中心人工智能所、上海联影智能医疗科技有限公司
起草人:山栋明、黄海清、漆远、邹亮、程远、石伯明、丁晓东、熊飞宇、孔令和、张林峰、钟俊浩、曹荣根、施佳樑、邓思文、杨闻博、曹宇、饶雪、赵春昊、汤洁、李孟渚、李吉羊、张 谦、张颖慧、宋纯锋、白磊、李萌、郑啟豪、王宇涵、李佳秾、唐诗翔、薛东雨、任昱宸、黄维然、冯 恺睿、李昊、罗烨、唐波、志宇、魏文强、蔡晓晨、李永超、龚奎、史涛涛、王建、肖玲、胡顺波、刘国鑫、陆知雨、陈若曦、路少卿、堵炜炜、虞祝豪、朱莉琴、杨文恺、郑更河、华静、宋佳琪、汤凯锋、 章伟、张驰、潘登、赵兴华、杜镇泽、胡兵、张洪、张伟、郭爱华、沈彦、肖红练、贺仁龙、郑茂宽、 陈巧慧、孙雯、王娜、沈滨、杨华,周永星,胡银银、李建君、张火箭、段冲、李卫、陈翔宇、谭晓坤、 郭汉杰、魏飞、陈磊、曲晓婷、林一琪