陈西贝
-
北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强
随着大语言模型LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如价值观、性格和社交智能?如何建立更全面、更可靠的 AI 评估体系?北京大学宋国杰教授团队最新...
-
IEA&IRENA:2025年能源进展报告
这项报告的副标题为“追踪可持续发展目标7”。该目标是要确保人人获得负担得起的、可靠和可持续的现代能源。这份报告由可持续发展目标7的五家托管机构共同完成,包括国际能源署、国际可再生能源署、联合国统计司、...