Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎
AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画
ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型
OpenAI o3 – OpenAI推出的新一代最强推理模型
StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合
RWKV-7 – RWKV系列的最新大模型架构版本,有强大的上下文学习能力
PromptWizard – 微软开源的 AI 提示词自动化优化框架
INFP – 音频驱动的生成逼真面部表情和头部姿态的AI框架
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token
AgentScope – 阿里开源的多智能体开发平台
LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术
3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目
ERA-42 – 星动纪元推出的端到端原生机器人大模型
Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型
VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集
Bamba-9B – 基于 Mamba2 架构的仅解码语言模型
Univer – 开源 AI 办公工具,支持Word、Excel等文档处理全栈解决方案
Kheish – 开源的多智能体协调平台,可灵活配置多个Agent解决复杂任务
HelloMeme – 面部表情与姿态迁移框架,基于Stable Diffusion 1.5模型理解能力