精选视频

Meta 推出 MoCha AI 系统：可生成同步语音与动作的角色动画

Meta 与滑铁卢大学的研究团队共同开发了一款名为 MoCha 的人工智能系统，能够生成包含同步语音和自然动作的完整角色动画。这一创新突破不同于以往仅聚焦于面部的动画生成模型，MoCha 可从多个摄像…

ElevenLabs发布全球首款犬类AI文本转语音模型“Text To Bark”

近日，人工智能音频技术领域的先锋企业ElevenLabs宣布推出全球首款专为犬类设计的AI文本转语音模型“Text To Bark”，引发了科技界和宠物爱好者的广泛关注。这一创新技术号称能够将人类输入…

Krea整合Gemini文字生图与图像编辑功能：Chat界面迎来实用性飞跃

近日，人工智能创意平台Krea宣布成功接入Google Gemini的文字生成图像及图像编辑功能，进一步提升了其平台的生成能力和用户交互体验。更新显著增强了Krea Chat界面的实用性，使其从单一的对话工具转变为一个集图像生成与编辑于一体的综合性创作平台。

Higgsfield AI 发布全新视频模型：电影级相机控制重塑创意边界

近日，Higgsfield AI 发布了其全新的生成式视频模型，引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出，为AI视频生成领域注入了新的活力。Higg…

Krea 上线3D 功能并重构网站：从文本到立体，创作秒成型

近日，生成式 AI 平台 Krea 宣布推出3D 生成功能，并同步完成网站界面的全面重构。这标志着 Krea 在技术创新与用户体验上的双重突破，进一步巩固其在创意工具领域的领先地位。 &nb…

Krea推出3D生成功能并全面升级网站界面，或采用混元技术优化体验

近日，人工智能创意平台Krea宣布正式上线3D生成功能，并同步完成了网站界面的全面重构。这一更新不仅为用户带来了全新的视觉体验和操作流程，还显著扩展了平台在生成式AI领域的应用范围。据业内人士推测，此…

宇树科技发布Dex5灵巧手:单手20自由度，挑战人类精细操作极限

近日，宇树科技正式发布其最新研发的Unitree Dex5灵巧手。据官方介绍，这款高性能灵巧手单手拥有高达20个自由度（16个主动自由度和4个被动自由度），并配备94个灵敏触点，展现出卓越的灵活性和感…

震撼！宇树G1人形机器人侧空翻惊艳全球，挑战真人运动极限！

宇树科技G1人形机器人完成惊艳侧空翻，成功树立新标杆。全球首个可执行侧空翻动作的机器人，挑战真人极限，引发全球关注。

波士顿动力最新Atlas机器人展现超越人类的动作能力

波士顿动力公司展示最新Atlas机器人的超凡动作能力，通过强化学习和动作捕捉技术，实现更自然、更灵活的类人动作，受到广泛关注。

波士顿动力Atlas机器人：动作能力突破，逼近人类水平

波士顿动力展示了最新动作能力突破，Atlas机器人逼近人类水平。通过强化学习和动作捕捉技术，Atlas展现更自然、更灵活的类人动作，推动人形机器人应用。

Open-Sora 2.0：突破性视频AI系统，成本仅为十分之一

HPC-AI Tech推出Open-Sora 2.0，仅需20万美元训练成本，质量可与商业系统媲美。其创新训练过程和DC-AE自动编码器带来超快训练速度和视频生成速度。

字节LCT创新技术：AI导演拍摄电影大片新突破

长上下文调整（LCT）技术让AI视频生成模型具备执导多镜头叙事视频能力，突破单镜头生成限制，实现更连贯、引人入胜的故事场景。

Anthropic发布Harmony功能：AI助手助您实现文件目录顺畅管理

Anthropic即将发布Harmony功能，允许用户将本地文件集成到AI助手的工作环境中，实现更流畅的文件互动。用户可以系统地索引和修改文件，结合AI编码助手的功能，提升信息搜索和分析效率。

AI对口型革命性突破:Captions新模型Mirage打造超真实UGC视频

近日，AI技术领域迎来重大突破，Captions公司正式推出全新AI模型Mirage，彻底颠覆传统对口型与视频生成技术。Mirage能够分析脚本或音频剪辑，实时生成不存在的人物出演的UGC（用户生成内…

王炸更新！谷歌AI Studio再进化：YouTube视频秒懂，AI作画还能保持角色统一

AI工具赛道再掀惊涛骇浪!谷歌AI Studio今日投下一枚重磅炸弹，其最新升级的功能在X平台瞬间引爆科技圈。用户惊呼，谷歌AI Studio 现在竟然可以直接“啃食”YouTube视频链接，无需下载…

Domo AI发布i2v模型升级：稳定性与提示词理解能力显著提升

Domo AI近日宣布其图像到视频（i2v）模型迎来重大升级，提升了稳定性与生成速度，在用户体验方面优势明显。更新还提高了对提示词的理解能力，为用户创作带来更高效便捷体验。

Pika视频交换功能Pikaswaps带来新可能性

Pika上线视频交换功能Pikaswaps，使用户能轻松实现视频中的服装替换等元素交换，为内容创作者和营销人员带来新的可能性。

稚晖君展示灵犀X2：融合三大智能的前沿人形机器人

近日，稚晖君展示了智元机器人的最新力作灵犀X2，这款融合了运动、交互和作业三大智能功能的人形机器人采用了多项先进技术，拥有28个自由度，具备优秀的技术水平。

Browser Use – 将AI插上翅膀的浏览器自动化新利器

Browser Use 是一款开源项目，为AI赋予强大的浏览器操作能力，拥有自然语言指令控制浏览器、支持多种AI模型、灵活部署等功能。X社区用户热情反馈证明了其应用潜力。

告别建模地狱！手绘草图秒变精细3D模型，MeshPad让设计师彻底解放双手

MeshPad彻底颠覆传统3D建模方式，草图转3D模型，编辑速度闪电般快，零延迟交互体验，人人成为3D设计师

AI数字人新突破！Hedra推出Character-3模型和Hedra Studio

Hedra推出Character-3模型，AI数字人视频生成技术飞跃。Character-3模型支持多模态融合，生成高质量视频内容。Hedra Studio是全民视频创作平台，降低视频制作门槛。

可灵AI特效 FuzzyFuzzy、MochiMochi和BoomBoom，创意玩法全解析

可灵最新版本KLING1.6推出首批AI特效活动:FuzzyFuzzy、MochiMochi、BoomBoom，用户上传图片即可享受视觉魔法。三大特效吸引眼球，赋予创意更多可能性，轻松打造独特视频内容。KLING1.6支持强大图像到视频生成能力，展示可灵在AI视觉领域的创新。

Runway发布新功能：视频转视频首帧图片风格转换，引领AI视频创作革新

Runway发布视频转视频新功能，用户可添加首帧图片实现风格转换，提高个性化灵活性。新功能受到广泛关注，用户热情反响，进一步推动AI视频生成技术发展。

NotaGen古典音乐生成模型发布，高品质音乐再现

近日，一款名为NotaGen的开源音乐生成模型正式亮相，迅速成为AI技术与艺术结合的热点话题。NotaGen以生成高品质古典音乐为核心亮点，展现了AI在音乐领域的强大潜力。此次开源不仅包括基础版本，还推出了一个受DeepSeekR1启发的增强模型Notagen-X。

即梦AI全量上线数字人-大师模式（OmniHuman-1）可根据音频生成生动数字人

字节的OmniHuman- 1 功能全新上线！即梦AI提供的数字人-大师模式让创作门槛降低，动作逼真流畅，表现力飙升！新一代数字人不再僵硬，支持全身动作生成，为短视频创作者、虚拟主播等带来效率飞升的可能性。AI数字人技术或将引领影视、游戏领域新风潮。

LTX-Video 0.9.5发布：支持商用许可，开源AI视频生成迈向新高度

2025年3月5日，Lightricks团队推出了备受期待的LTX-Video 0.9.5版本，这一基于DiT的开源AI视频生成模型，带来了强大功能更新和开放的商用许可。

谷歌Gemini 2.0 AI Overviews及AI Mode新升级引发热议

谷歌今日宣布Gemini 2.0技术整合至AI Overviews，推出AI Mode实验功能，旨在提升搜索体验。Gemini 2.0助力AI Overviews智能回答，AI Mode满足高级用户需求。

谷歌Colab数据科学助手：简化数据分析工作，提升效率

谷歌推出数据科学助手(Data Science Agent)简化数据分析工作。通过Gemini技术生成完整工作笔记本，提升分析效率，节省时间。