来自北京精民社会福利研究院、Campbell循证社会科学中国联盟、中国发展战略学研究会智库专业委员会等机构的主办单位负责人致辞,对本次研讨会表示高度认可。发言者们一致认为,AI的发展势不可挡,学者们应积极拥抱这一变革,推动跨学科合作,探索AI在社会科学中的创新应用。
在主旨发言环节,各位讲者基于各自的学科视角,主要讨论了我国人工智能发展现状及未来战略。杨国梁研究员介绍了我国在人工智能领域的优势和挑战,并提出了应对全球竞争的战略建议。吴喜之教授从批判传统统计学的角度,指出了传统统计方法的局限性,强调了机器学习和大语言模型在数据驱动分析中的重要性,并呼吁学界转向更具预测精度的现代数据科学方法。李军博士从计算机角度介绍了人工智能在社会科学中的应用,回顾了符号主义、连接主义和行为主义三大学派的发展。他详细讲解了大语言模型(如ChatGPT)的原理及其在文本理解和生成中的作用,并探讨了其在社会科学中的实际应用,如知识检索、问答生成和个性化推荐,同时分享了他所在公司的探索经验。乔晓春教授分享了他的思考,重点讨论了大语言模型对中国社会科学研究和教育的影响。他指出,大语言模型可以显著改变传统的教学和学习方式,提供更高效、个性化的学习路径,但也带来了许多挑战,如对原创性的威胁和考核制度的变革。他强调,大语言模型无法取代批判性思维和创新能力,建议学者们将AI视为合作伙伴,而不是简单的工具。何国忠教授在点评中总结道,不论AI如何发展,每个人都需要从自身的领域出发,积极拥抱新技术,并不断学习以保持竞争力。他还提出了在未来教育中,智商与逆商(抗压能力)同样重要,呼吁大家要在新的学习方式中找到适合自己的路径,共同迎接未来的挑战。
吴喜之教授强调了编程在跨学科研究中的关键作用,建议研究者通过实际编写程序来培养数据思维,而不仅仅依赖现成的工具和代码。他质疑了传统统计学中的显著性检验和回归分析,指出这些方法在现代科学研究中的局限性,甚至可能误导结果。吴教授还强调,编程不应仅限于数学背景的人掌握,任何具备逻辑思维的人都可以通过简单的问题逐步积累编程能力。 在跨学科研究方面,讨论指出,非计算机背景的研究者在应对人工智能和大数据时面临挑战,特别是在培养数据思维方面。吴教授建议通过基础编程训练,结合具体领域的问题,逐步提升对数据科学的理解和应用能力。其他学者补充道,人文社科领域与计算机科学的结合,需要明确的问题和需求,成功的跨学科合作依赖于需求与技术的有效对接。 在统计学教育方面,讨论集中在传统统计内容在现代数据科学背景下的有效性问题。吴教授认为,传统统计学的一些内容可能已不再适应当今的研究需求,建议引入更多机器学习和数据科学的内容。培养学生时,不仅要关注工具的使用,还需深入理解背后的原理,培养学生对数据和问题的深刻理解,以在研究中做出更有效的分析和决策。 关于机器学习与统计学的关系,讨论涉及如何在应用中平衡这两者。吴教授提到,现代机器学习方法(如随机森林)在解决复杂问题时具有独特优势,而传统统计方法在某些情况下可能不足以应对复杂的现实问题。
这场对话为跨学科研究者和教育者提供了理论与实际操作层面的宝贵见解。 讨论还涉及大数据和人工智能在药物研发中的应用。与会者指出,人工智能可以大大加速药物筛选,通过机器学习预筛选潜在候选药物,再进行实验验证,从而显著缩短研发时间。这种方法强调数据驱动的决策,与传统显著性检验方法有明显不同。 在新闻文本分析中,研究生提出使用大模型进行内容分析的挑战。尽管大模型在立场和情感分析上表现良好,但在价值观或道德判断等深层次问题上,模型的结果可能不稳定且一致性不高。吴教授回应称,社会科学中本就难以期待完全一致的结果,大模型的模糊性和不确定性也是正常的。 关于机器学习的可解释性,讨论提到,虽然随机森林和决策树等模型可以解释变量的重要性,但更复杂的模型如深度学习面临“黑盒子”问题,难以解释其内部逻辑。学者们还讨论了如何通过贝叶斯统计或小样本学习来应对数据稀缺的问题,强调在有限数据条件下有效建模和推断的重要性。
最后,讨论涉及了大数据的真实性问题。由于数据来源可能被污染或扭曲,这些数据往往无法真实反映现实世界,尤其在社交媒体和广告推送中,这种失真现象更加明显,影响了研究结论和社会认知。学者们总结了小样本研究的挑战和可能的应对方法,如数据合成和增强技术,以提高研究的可靠性。在整个讨论中,强调了研究者在处理现代数据分析时,必须保持对数据来源和分析方法的批判性思考。
研讨会在热烈的讨论中圆满结束。与会者们对各个环节的深入探讨表示高度赞赏,纷纷表示本次研讨会内容丰富,涵盖了从统计学、人工智能到跨学科研究的诸多前沿话题,给他们带来了极大的启发。通过此次交流,大家不仅加深了对现代数据科学和机器学习在社会科学中应用的理解,还获得了很多切实可行的研究建议。