分类目录介绍:
精选最新、最前沿的行业视频,深入探索AI技术在各领域的最新应用与未来发展趋势。内容涵盖核心技术、市场机遇,为行业决策者、研究人员和技术爱好者提供一手研究资料与行业洞察。
内容持续更新中
Meta 与滑铁卢大学的研究团队共同开发了一款名为 MoCha 的人工智能系统,能够生成包含同步语音和自然动作的完整角色动画。这一创新突破不同于以往仅聚焦于面部的动画生成模型,MoCha 可从多个摄像…
近日,人工智能音频技术领域的先锋企业ElevenLabs宣布推出全球首款专为犬类设计的AI文本转语音模型“Text To Bark”,引发了科技界和宠物爱好者的广泛关注。这一创新技术号称能够将人类输入…
近日,人工智能创意平台Krea宣布成功接入Google Gemini的文字生成图像及图像编辑功能,进一步提升了其平台的生成能力和用户交互体验。更新显著增强了Krea Chat界面的实用性,使其从单一的对话工具转变为一个集图像生成与编辑于一体的综合性创作平台。
近日,Higgsfield AI 发布了其全新的生成式视频模型,引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出,为AI视频生成领域注入了新的活力。Higg…
近日,生成式 AI 平台 Krea 宣布推出3D 生成功能,并同步完成网站界面的全面重构。这标志着 Krea 在技术创新与用户体验上的双重突破,进一步巩固其在创意工具领域的领先地位。 &nb…
近日,人工智能创意平台Krea宣布正式上线3D生成功能,并同步完成了网站界面的全面重构。这一更新不仅为用户带来了全新的视觉体验和操作流程,还显著扩展了平台在生成式AI领域的应用范围。据业内人士推测,此…
近日,宇树科技正式发布其最新研发的Unitree Dex5灵巧手。据官方介绍,这款高性能灵巧手单手拥有高达20个自由度(16个主动自由度和4个被动自由度),并配备94个灵敏触点,展现出卓越的灵活性和感…
宇树科技G1人形机器人完成惊艳侧空翻,成功树立新标杆。全球首个可执行侧空翻动作的机器人,挑战真人极限,引发全球关注。
波士顿动力公司展示最新Atlas机器人的超凡动作能力,通过强化学习和动作捕捉技术,实现更自然、更灵活的类人动作,受到广泛关注。
波士顿动力展示了最新动作能力突破,Atlas机器人逼近人类水平。通过强化学习和动作捕捉技术,Atlas展现更自然、更灵活的类人动作,推动人形机器人应用。
HPC-AI Tech推出Open-Sora 2.0,仅需20万美元训练成本,质量可与商业系统媲美。其创新训练过程和DC-AE自动编码器带来超快训练速度和视频生成速度。
长上下文调整(LCT)技术让AI视频生成模型具备执导多镜头叙事视频能力,突破单镜头生成限制,实现更连贯、引人入胜的故事场景。
Anthropic即将发布Harmony功能,允许用户将本地文件集成到AI助手的工作环境中,实现更流畅的文件互动。用户可以系统地索引和修改文件,结合AI编码助手的功能,提升信息搜索和分析效率。
近日,AI技术领域迎来重大突破,Captions公司正式推出全新AI模型Mirage,彻底颠覆传统对口型与视频生成技术。Mirage能够分析脚本或音频剪辑,实时生成不存在的人物出演的UGC(用户生成内…
AI工具赛道再掀惊涛骇浪!谷歌AI Studio今日投下一枚重磅炸弹,其最新升级的功能在X平台瞬间引爆科技圈。用户惊呼,谷歌AI Studio 现在竟然可以直接“啃食”YouTube视频链接,无需下载…
Domo AI近日宣布其图像到视频(i2v)模型迎来重大升级,提升了稳定性与生成速度,在用户体验方面优势明显。更新还提高了对提示词的理解能力,为用户创作带来更高效便捷体验。
Pika上线视频交换功能Pikaswaps,使用户能轻松实现视频中的服装替换等元素交换,为内容创作者和营销人员带来新的可能性。
近日,稚晖君展示了智元机器人的最新力作灵犀X2,这款融合了运动、交互和作业三大智能功能的人形机器人采用了多项先进技术,拥有28个自由度,具备优秀的技术水平。
Browser Use 是一款开源项目,为AI赋予强大的浏览器操作能力,拥有自然语言指令控制浏览器、支持多种AI模型、灵活部署等功能。X社区用户热情反馈证明了其应用潜力。
MeshPad彻底颠覆传统3D建模方式,草图转3D模型,编辑速度闪电般快,零延迟交互体验,人人成为3D设计师
Hedra推出Character-3模型,AI数字人视频生成技术飞跃。Character-3模型支持多模态融合,生成高质量视频内容。Hedra Studio是全民视频创作平台,降低视频制作门槛。
可灵最新版本KLING1.6推出首批AI特效活动:FuzzyFuzzy、MochiMochi、BoomBoom,用户上传图片即可享受视觉魔法。三大特效吸引眼球,赋予创意更多可能性,轻松打造独特视频内容。KLING1.6支持强大图像到视频生成能力,展示可灵在AI视觉领域的创新。
Runway发布视频转视频新功能,用户可添加首帧图片实现风格转换,提高个性化灵活性。新功能受到广泛关注,用户热情反响,进一步推动AI视频生成技术发展。
近日,一款名为NotaGen的开源音乐生成模型正式亮相,迅速成为AI技术与艺术结合的热点话题。NotaGen以生成高品质古典音乐为核心亮点,展现了AI在音乐领域的强大潜力。此次开源不仅包括基础版本,还推出了一个受DeepSeekR1启发的增强模型Notagen-X。
字节的OmniHuman- 1 功能全新上线!即梦AI提供的数字人-大师模式让创作门槛降低,动作逼真流畅,表现力飙升!新一代数字人不再僵硬,支持全身动作生成,为短视频创作者、虚拟主播等带来效率飞升的可能性。AI数字人技术或将引领影视、游戏领域新风潮。
2025年3月5日,Lightricks团队推出了备受期待的LTX-Video 0.9.5版本,这一基于DiT的开源AI视频生成模型,带来了强大功能更新和开放的商用许可。
谷歌今日宣布Gemini 2.0技术整合至AI Overviews,推出AI Mode实验功能,旨在提升搜索体验。Gemini 2.0助力AI Overviews智能回答,AI Mode满足高级用户需求。
谷歌推出数据科学助手(Data Science Agent)简化数据分析工作。通过Gemini技术生成完整工作笔记本,提升分析效率,节省时间。