分类目录介绍:
精选最新、最前沿的行业视频,深入探索AI技术在各领域的最新应用与未来发展趋势。内容涵盖核心技术、市场机遇,为行业决策者、研究人员和技术爱好者提供一手研究资料与行业洞察。
内容持续更新中
来自香港科技大学和清华大学的研究团队推出了一项名为 DimensionX 的全新 AI 框架,仅凭一张图片便能生成充满细节的3D 和4D 场景,为游戏开发、虚拟现实和影视制作等领域带来革命性的突破! …
CogSound 是一款基于人工智能技术的音效生成模型,能够根据视频内容自动生成与画面匹配的音效,为无声视频添加逼真的音频体验。 CogSound 的生成能力涵盖了多种复杂音效,例如爆炸声、水流声以及…
谷歌近日正式推出了一款名为 Vids 的 AI 视频演示应用程序,该应用由其 Gemini AI 模型驱动,用户只需输入简单的文字提示或上传 Google Drive 中的文档,即可轻松生成视频演示文…
在集成了Luma、可灵、海螺、Runway等几大视频模型后,Krea AI又上线了Lora训练功能。 无论你是什么电脑配置,只要上传超过3张以上的图片,你就可以轻松训练出专属于你的角色、风格、产品等。…
谷歌研究院最近推出了一项名为ReCapture的全新技术,这项技术可以让你从全新的视角重新体验你自己的视频。ReCapture技术可以根据用户提供的视频,生成一个带有自定义摄像机轨迹的新版本,这意味着…
近日,字节跳动推出一款最新肖像动画技术X-Portrait2,旨在以超低成本和高效的方式创造富有表现力和逼真的角色动画。用户只需提供静态肖像图像和表现驱动视频,X-Portrait2即可通过将视频中的…
香港科技大学、中国科学技术大学等机构的研究人员近日发布了 GameGen-X 模型,这是一个专为生成和互动控制开放世界游戏视频而设计的扩散变换器模型。 GameGen-X能自己生成开放世界游戏视频,可…
一个革命性的开源音频模型——Hertz-dev横空出世,凭借其惊人的性能指标,让全球开发者为之震撼。这款拥有85亿参数的AI语音巨兽,通过2000万小时高质量音频数据的训练,成功实现了人类梦寐以求的全…
近日,Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B,这款语音到语音模型能够高效、精确地生成和处理语音,尤其擅长模拟或克隆不同的声音。这意味着,我们距离拥有一个声音…
设计师、开发者们终于可以摆脱被“屏幕适配”支配的恐惧了!Rive 近期发布了名为 Layouts 的全新功能,允许用户创建动态且响应式的动画图形,这些图形可以自动适应不同的设备和屏幕尺寸,同时保持 R…
Meta FAIR 实验室近日发布了一项名为“Sparsh”的人工多模态指尖触觉感知技术,该技术可赋予机器人近似人类的触觉感知能力,有望在机器人操控领域带来革命性的变化。 Sparsh 模型采用自监督…
人工智能公司ElevenLabs最近发布了一个引人注目的开源项目"X-to-Voice",这款工具能够智能分析Twitter用户资料,自动生成与用户个性相匹配的数字声音和动态头像。…
AI音乐生成平台Suno又放大招了!最新推出的Personas功能让用户可以"复制"自己钟爱的音乐风格,一键生成带有个人特色的AI音乐,让每个人都能打造专属音乐IP。 这项突破性功…
告别“提示词”炼丹!最近skybox 团队 Blockade Labs推出了牛逼的新品blendbox.ai,在AI生图里面引入了图层的概念,让你可以像用PS作图一样,更可控地生成符合要求的图片。 B…
在 ChatGPT 两周岁生日之际,OpenAI 宣布为其推出了全新的人工智能搜索体验,ChatGPT 正式升级为 AI 搜索引擎,并且免费开放使用。这项更新标志着 ChatGPT 补齐了实时信息获取…
近日,3D数字人类建模领域的创新企业Meshcapade凭借其突破性的人体动作生成技术引发业界关注。该公司通过将复杂的人类行为压缩为100个数字的参数化模型SMPL,正在重新定义数字人类建模的未来。 …
波士顿动力公司的新一代人形机器人Atlas在幕后持续进行重大改进。最新发布的演示视频展示了这款电动机器人在工厂环境中的出色表现,揭示了其在自主操作方面取得的突破性进展。 在周三发布的最新视频中,Atl…
科技创业公司Wonder Dynamics近日发布了一款颠覆性的AI工具Wonder Animation测试版,这家由好莱坞演员Tye Sheridan联合创立的公司,正在用人工智能重新定义影视制作流…
谷歌最新发布的语音生成技术再次刷新了业界标准。这项突破性技术不仅能在3秒内生成长达2分钟的自然对话,还能确保多说话人之间的语音连贯性和音质表现。该技术已在Gemini Live、Project Ast…
爱诗科技最新发布的PixVerse V3版本带来了全方位的功能升级,一举跻身顶级视频生成平台行列。该版本在视频清晰度和提示词理解方面都有显著提升,为创作者带来更专业、更好玩的体验。 PixVerse …
苹果公司今日发布了全新的iMac,这款设备搭载了强大的M4芯片和Apple Intelligence,继续保持了其超薄的惊艳设计。新款iMac将于11月8日星期五正式发售,起售价为1299美元。 M4…
近期,趣丸科技发布了名为MaskGCT的全新语音合成(TTS)模型,该模型在语音质量、相似度和可控性方面取得了显著突破,直接颠覆了传统语音合成(TTS)的玩法,让AI彻底摆脱了对人工标注的依赖,实现了…
近日,字节跳动开发了一款名为PersonaTalk的AI模型,该模型可以为视频精准配音。 这项技术不仅能够实现声音与嘴型的完美同步,还能在生成新视频时保留人物的原始说话风格、面部特征和表情…
谷歌DeepMind近日推出了其AI音乐制作工具MusicFX DJ的更新版本,这一工具旨在服务于有或没有音乐专业知识的用户。该公司在今年的谷歌I/O大会上首次展示了这款软件。 与常规DJ软件混合预录…
KREA AI最新推出的Video Extend功能在视频创作领域掀起一波创新浪潮。这项突破性的技术巧妙地将真实视频与AI生成内容完美融合,为创作者提供了前所未有的视频特效制作体验。 该功能的核心亮点…
近日,Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中,并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型 (LLM…
ElevenLabs日前发布全新AI语音生成工具Voice Design,通过简单的文本描述即可创建个性化语音,开创了AI配音领域的新纪元。 这款工具最大的特点是其直观的文本提示功能。用户只需描述所需…
视频生成领域迎来重大突破!Genmo 公司重磅开源了其最新的视频生成模型 Mochi1,为视频生成领域树立了新的标杆。Mochi1采用创新的 Asymmetric Diffusion Transfor…