精选视频 | 第 5 页 | 七个圈

首页
分类目录
精选视频
全部文章

精选视频

分类目录介绍：

精选最新、最前沿的行业视频，深入探索AI技术在各领域的最新应用与未来发展趋势。内容涵盖核心技术、市场机遇，为行业决策者、研究人员和技术爱好者提供一手研究资料与行业洞察。

306篇

内容持续更新中

创米学院

变现指南

权威报告

精选视频

行业资讯

告别建模苦恼！DimensionX单图生成3D/4D场景带你玩转“空间魔法”

告别建模苦恼！DimensionX单图生成3D/4D场景带你玩转“空间魔法”

来自香港科技大学和清华大学的研究团队推出了一项名为 DimensionX 的全新 AI 框架，仅凭一张图片便能生成充满细节的3D 和4D 场景，为游戏开发、虚拟现实和影视制作等领域带来革命性的突破! …

七个圈

视频也能脑补配音？CogSound让视频“声”动起来，从此告别无声尴尬！

视频也能脑补配音？CogSound让视频“声”动起来，从此告别无声尴尬！

CogSound 是一款基于人工智能技术的音效生成模型，能够根据视频内容自动生成与画面匹配的音效，为无声视频添加逼真的音频体验。 CogSound 的生成能力涵盖了多种复杂音效，例如爆炸声、水流声以及…

七个圈

谷歌推出AI视频制作神器Vids：输入文字秒变视频，小白也能轻松创作！

谷歌推出AI视频制作神器Vids：输入文字秒变视频，小白也能轻松创作！

谷歌近日正式推出了一款名为 Vids 的 AI 视频演示应用程序，该应用由其 Gemini AI 模型驱动，用户只需输入简单的文字提示或上传 Google Drive 中的文档，即可轻松生成视频演示文…

七个圈

氪金玩家狂喜！Krea AI上线Lora训练功能 “炼丹”变得如此简单

氪金玩家狂喜！Krea AI上线Lora训练功能 “炼丹”变得如此简单

在集成了Luma、可灵、海螺、Runway等几大视频模型后，Krea AI又上线了Lora训练功能。无论你是什么电脑配置，只要上传超过3张以上的图片，你就可以轻松训练出专属于你的角色、风格、产品等。…

七个圈

让大象转身！谷歌黑科技 ReCapture：可一键生成“多机位”视频大片

让大象转身！谷歌黑科技 ReCapture：可一键生成“多机位”视频大片

谷歌研究院最近推出了一项名为ReCapture的全新技术，这项技术可以让你从全新的视角重新体验你自己的视频。ReCapture技术可以根据用户提供的视频，生成一个带有自定义摄像机轨迹的新版本，这意味着…

七个圈

字节推出单图视频驱动模型 X-Portrait 2 超低成本高效的肖像动画技术

字节推出单图视频驱动模型 X-Portrait 2 超低成本高效的肖像动画技术

近日，字节跳动推出一款最新肖像动画技术X-Portrait2，旨在以超低成本和高效的方式创造富有表现力和逼真的角色动画。用户只需提供静态肖像图像和表现驱动视频，X-Portrait2即可通过将视频中的…

七个圈

黑神话悟空也能用AI生成了？GameGen-X 颠覆游戏开发，传统游戏瑟瑟发抖！

黑神话悟空也能用AI生成了？GameGen-X 颠覆游戏开发，传统游戏瑟瑟发抖！

香港科技大学、中国科学技术大学等机构的研究人员近日发布了 GameGen-X 模型，这是一个专为生成和互动控制开放世界游戏视频而设计的扩散变换器模型。 GameGen-X能自己生成开放世界游戏视频，可…

七个圈

首个会话音频开源模型Hertz-dev 120毫秒超低延迟惊艳全网

首个会话音频开源模型Hertz-dev 120毫秒超低延迟惊艳全网

一个革命性的开源音频模型——Hertz-dev横空出世，凭借其惊人的性能指标，让全球开发者为之震撼。这款拥有85亿参数的AI语音巨兽，通过2000万小时高质量音频数据的训练，成功实现了人类梦寐以求的全…

七个圈

Fish Audio发布Fish Agent V0.1 3B 实时语音克隆

Fish Audio发布Fish Agent V0.1 3B 实时语音克隆

近日，Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B，这款语音到语音模型能够高效、精确地生成和处理语音，尤其擅长模拟或克隆不同的声音。这意味着，我们距离拥有一个声音…

七个圈

动画设计福音！Rive推Layouts功能画面自动适配各种屏幕，搞定排版难题！

动画设计福音！Rive推Layouts功能画面自动适配各种屏幕，搞定排版难题！

设计师、开发者们终于可以摆脱被“屏幕适配”支配的恐惧了!Rive 近期发布了名为 Layouts 的全新功能，允许用户创建动态且响应式的动画图形，这些图形可以自动适应不同的设备和屏幕尺寸，同时保持 R…

七个圈

Meta最新黑科技：Sparsh赋予机器人“人类级”触觉，灵巧操作不再是梦！

Meta最新黑科技：Sparsh赋予机器人“人类级”触觉，灵巧操作不再是梦！

Meta FAIR 实验室近日发布了一项名为“Sparsh”的人工多模态指尖触觉感知技术，该技术可赋予机器人近似人类的触觉感知能力，有望在机器人操控领域带来革命性的变化。 Sparsh 模型采用自监督…

七个圈

ElevenLabs推开源小项目X-to-Voice：一键将Twitter账号转化为个性化虚拟形象

ElevenLabs推开源小项目X-to-Voice：一键将Twitter账号转化为个性化虚拟形象

人工智能公司ElevenLabs最近发布了一个引人注目的开源项目"X-to-Voice"，这款工具能够智能分析Twitter用户资料，自动生成与用户个性相匹配的数字声音和动态头像。…

七个圈

重磅突破！Suno新增AI歌手克隆功能，一键复刻专属音乐风格，网友：这很李白

重磅突破！Suno新增AI歌手克隆功能，一键复刻专属音乐风格，网友：这很李白

AI音乐生成平台Suno又放大招了!最新推出的Personas功能让用户可以"复制"自己钟爱的音乐风格，一键生成带有个人特色的AI音乐，让每个人都能打造专属音乐IP。这项突破性功…

七个圈

带图层的AI生图软件来了！Blendbox Alpha 版发布支持实时调光影、改构图

带图层的AI生图软件来了！Blendbox Alpha 版发布支持实时调光影、改构图

告别“提示词”炼丹!最近skybox 团队 Blockade Labs推出了牛逼的新品blendbox.ai，在AI生图里面引入了图层的概念，让你可以像用PS作图一样，更可控地生成符合要求的图片。 B…

七个圈

OpenAI 放大招！ChatGPT 搜索引擎免费开放谷歌慌了？

OpenAI 放大招！ChatGPT 搜索引擎免费开放谷歌慌了？

在 ChatGPT 两周岁生日之际，OpenAI 宣布为其推出了全新的人工智能搜索体验，ChatGPT 正式升级为 AI 搜索引擎，并且免费开放使用。这项更新标志着 ChatGPT 补齐了实时信息获取…

七个圈

Meshcapade推出SMPL建模技术：100个参数实现3D人体动作精准还原

阅读量飙升

Meshcapade推出SMPL建模技术：100个参数实现3D人体动作精准还原

近日，3D数字人类建模领域的创新企业Meshcapade凭借其突破性的人体动作生成技术引发业界关注。该公司通过将复杂的人类行为压缩为100个数字的参数化模型SMPL，正在重新定义数字人类建模的未来。 …

七个圈

波士顿动力电动版Atlas机器人重大突破：自主完成工厂任务，动作更灵活精准

阅读量飙升

波士顿动力电动版Atlas机器人重大突破：自主完成工厂任务，动作更灵活精准

波士顿动力公司的新一代人形机器人Atlas在幕后持续进行重大改进。最新发布的演示视频展示了这款电动机器人在工厂环境中的出色表现，揭示了其在自主操作方面取得的突破性进展。在周三发布的最新视频中，Atl…

七个圈

好莱坞黑科技！Wonder Dynamics发布视频转3D功能一键生成3D动画场景

好莱坞黑科技！Wonder Dynamics发布视频转3D功能一键生成3D动画场景

科技创业公司Wonder Dynamics近日发布了一款颠覆性的AI工具Wonder Animation测试版，这家由好莱坞演员Tye Sheridan联合创立的公司，正在用人工智能重新定义影视制作流…

七个圈

谷歌重磅升级AI语音技术：2分钟对话3秒生成，将彻底改变人机交互方式

谷歌重磅升级AI语音技术：2分钟对话3秒生成，将彻底改变人机交互方式

谷歌最新发布的语音生成技术再次刷新了业界标准。这项突破性技术不仅能在3秒内生成长达2分钟的自然对话，还能确保多说话人之间的语音连贯性和音质表现。该技术已在Gemini Live、Project Ast…

七个圈

又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

又要被玩坏了！PixVerse V3升级：不但能玩AI捏捏，还能让杯子长腿

爱诗科技最新发布的PixVerse V3版本带来了全方位的功能升级，一举跻身顶级视频生成平台行列。该版本在视频清晰度和提示词理解方面都有显著提升，为创作者带来更专业、更好玩的体验。 PixVerse …

七个圈

苹果推配备M4的新款iMac Apple Intelligence解锁Mac更多可能

苹果推配备M4的新款iMac Apple Intelligence解锁Mac更多可能

苹果公司今日发布了全新的iMac，这款设备搭载了强大的M4芯片和Apple Intelligence，继续保持了其超薄的惊艳设计。新款iMac将于11月8日星期五正式发售，起售价为1299美元。 M4…

七个圈

摆脱人工标注魔咒！趣丸科技MaskGCT模型用10万小时数据，教会AI自己说话

摆脱人工标注魔咒！趣丸科技MaskGCT模型用10万小时数据，教会AI自己说话

近期，趣丸科技发布了名为MaskGCT的全新语音合成（TTS）模型，该模型在语音质量、相似度和可控性方面取得了显著突破，直接颠覆了传统语音合成(TTS)的玩法，让AI彻底摆脱了对人工标注的依赖，实现了…

七个圈

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

近日，字节跳动开发了一款名为PersonaTalk的AI模型，该模型可以为视频精准配音。这项技术不仅能够实现声音与嘴型的完美同步，还能在生成新视频时保留人物的原始说话风格、面部特征和表情…

七个圈

谷歌DeepMind发布MusicFX DJ更新版：AI音乐制作工具新突破

谷歌DeepMind发布MusicFX DJ更新版：AI音乐制作工具新突破

谷歌DeepMind近日推出了其AI音乐制作工具MusicFX DJ的更新版本，这一工具旨在服务于有或没有音乐专业知识的用户。该公司在今年的谷歌I/O大会上首次展示了这款软件。与常规DJ软件混合预录…

七个圈

KREA AI推出视频延展功能可以给真实视频加上各种魔法特效

KREA AI推出视频延展功能可以给真实视频加上各种魔法特效

KREA AI最新推出的Video Extend功能在视频创作领域掀起一波创新浪潮。这项突破性的技术巧妙地将真实视频与AI生成内容完美融合，为创作者提供了前所未有的视频特效制作体验。该功能的核心亮点…

七个圈

Google DeepMind 为 Gemini 开源 AI 文本水印

Google DeepMind 为 Gemini 开源 AI 文本水印

近日，Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中，并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型（LLM…

七个圈

ElevenLabs 推出AI语音生成工具 Voice Design 简单文本即可创建个性化语音

阅读量飙升

ElevenLabs 推出AI语音生成工具 Voice Design 简单文本即可创建个性化语音

ElevenLabs日前发布全新AI语音生成工具Voice Design，通过简单的文本描述即可创建个性化语音，开创了AI配音领域的新纪元。这款工具最大的特点是其直观的文本提示功能。用户只需描述所需…

七个圈

Genmo 重磅开源视频生成模型 Mochi 1：高画质、超流畅，家用电脑也能创作好莱坞级大片！

Genmo 重磅开源视频生成模型 Mochi 1：高画质、超流畅，家用电脑也能创作好莱坞级大片！

视频生成领域迎来重大突破!Genmo 公司重磅开源了其最新的视频生成模型 Mochi1，为视频生成领域树立了新的标杆。Mochi1采用创新的 Asymmetric Diffusion Transfor…

七个圈

贡献榜

贡献文章数

七个圈

七个圈

关注AI领域动态，传递精准资讯，助力读者洞悉AI行业的最新资讯。

创米

AI学习引路人，专注编写、收集整理AI知识，为学习者提供清晰、实用的学习内容。

AI情报

AI情报

向圈友们分享AIGC活动招募信息，共建内容，分享自己的学习心得、交流经验。

AI领航员

AI领航员

AI变现策略探索者，乐于向个人创业者分享AI技术如何助力创新与变现。