CodeArena – 用于测试不同LLM编程能力的在线平台
Phi-4 – 微软推出的14B参数小语言模型,擅长数学等领域的复杂推理
Insight-V – 提升长链视觉推理能力的多模态模型
SVDQuant – MIT 推出的扩散模型后训练量化技术
Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型
Step-1o – 阶跃星辰推出的国内首个千亿参数端到端语音大模型
360gpt2-o1 – 360 推出国产自研 AI 大模型,多项评测优于GPT-4o
POINTS 1.5 – 腾讯微信推出的多模态大模型
k1 视觉思考模型 – kimi推出的 k1 系列强化学习模型
FreeScale – 无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像
Freestyler – 西工大联合微软和香港大学推出的说唱乐生成模型
SnapGen – Snap联合港科大等机构推出的移动端文生图模型
豆包视觉理解模型 – 豆包推出视觉理解模型,具备识别和推理能力
CosyVoice 2.0 – 阿里开源的语音生成大模型
Megrez-3B-Omni – 无问芯穹开源的端侧全模态理解模型
Veo 2 – 谷歌 DeepMind 推出的 AI 视频生成模型,支持高达 4K 分辨率
RDT – 清华开源的双臂机器人扩散基础模型
Apollo – Meta 联合斯坦福大学推出的大型多模态模型
BrushEdit – 腾讯和北大等联合推出的图像编辑框架,指令引导图像编辑和修复
Bocha Semantic Reranker – 博查推出的语义排序模型