AI顶会ICLR最新演讲TheChatGLM39sRoadtoAGI首个中

shadowrocket • 2026年1月26日 am1:39 • shadowrocket, shadowrocket下载, shadowrocket网站, 小火箭, 小火箭下载, 小火箭节点, 科学上网

干货

作者：黄元帅，成员

北京时间5月9日晚，第十二届国际学习表征会议(International Conference on Learning Representations， ICLR ) 在奥地利维也纳展览会议中心举办。

ICLR 由深度学习巨头、图灵奖获得者Yoshua Bengio 和 Yann LeCun 在2013年牵头发起，与ICML、NeurIPS 并称为机器学习领域水平最高的会议之一。本届ICLR在参展人数、展览规模、论文数量上均创新高。

作为本场大会的亮点之一，智谱AI与OpenAI、Meta、Google等行业巨头并列参展，智谱GLM大模型技术团队也受邀进行了名为《The ChatGLM's Road to AGI》的主旨演讲，回顾了国产自研大模型 ChatGLM 的演进之路，还阐述了GLM大模型面向AGI的三大技术趋势。

这是中国大模型团队首度登上 ICLR 主旨演讲环节，再次证明了其在全球人工智能领域的创新力和影响力。

主旨演讲内容

一、智谱大模型发展路线

ChatGLM的研发始于2019年，2020年底研发GLM预训练架构，2021年训练完成百亿参数模型GLM-10B，同年利用MoE架构成功训练出收敛的万亿稀疏模型，2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。迄今为止已公开超过 100个项目的源代码。

智谱旨在提供一个比ChatGPT更优化的选择。

二、拥抱开源与共享

智谱致力于将其研发的语言模型GLM-130B、ChatGLM-6B等广泛开源，使全球开发者都能利用这些工具进行研究和开发，从而打造开发者生态，实现行业可持续发展。

ChatGLM-6B模型累计四周 HuggingFace趋势榜第一，下载量达到了 1300万+ 。Github 6w+stars ，显示了其在用户中的受欢迎程度。

2023年底，Hugging Face公布社区最受欢迎的人工智能组织，智谱大模型团队（thukeg）排名第五，是唯一一个来自亚洲的机构。

三、多模态学习与视觉语言模型方向

智谱AI不仅在现有技术上进行优化，也在探索AI技术的未来发展方向，尤其是在模型整合和跨模态能力方面。

其中包括开发视觉语言模型，这种模型能够结合视觉和语言信息，进行更复杂的推理和解答，从而在AI交互中提供更自然和直观的体验。

智谱大模型团队发布的CogVLM，是一个可训练的视觉专家模块，能够将大语言模型和视觉编码器之间的鸿沟填补起来。

四、涌现能力与模型性能

你是否相信大型语言模型LLM有涌现能力？

智谱大模型团队指出，相比模型大小或训练计算量，智能涌现（Scaling Law）和预训练损失有更加紧密的联系。

五、2024 AGI前瞻

AGI将意味着什么？在未来，大语言模型的不同应用，例如聊天、OCR识别等功能的第一步仍然是模态中的文本。即便未来将不同的模态——文本、图像、视频、音频混在

THE END

二维码

达到1kstars后我对大模型开源教程的反思

WTF谷歌解散了Python团队

下一篇>>

搜索内容