精选视频 | 第 3 页 | 七个圈

首页
分类目录
精选视频
全部文章

精选视频

306篇

内容持续更新中

AI产品发布

AI大咖人物

AI技术应用

AI权威报告

AI活动情报

AI课程-写作

AI课程-办公

AI课程-基础

AI课程-绘画

AI课程-视频

AI课程-音频

创米学院

变现指南

精选视频

潞晨科技发布全新Video Ocean V2.0：免费视频生成模型再进化，20秒高清大片一键成型

潞晨科技发布全新Video Ocean V2.0：免费视频生成模型再进化，20秒高清大片一键成型

在这个万物皆可AI的时代，视频创作又迎来了一次重大升级。潞晨科技最新发布的Video Ocean V2.0不仅完全免费，更在画质、动态表现和创作自由度上实现了突破性进展。这款源自开源项目Open S…

七个圈

卷疯了！海螺AI推出"主体参考"功能一张图片就能玩转电影大片

卷疯了！海螺AI推出"主体参考"功能一张图片就能玩转电影大片

这个年底，国内视频大厂们都卷疯了!昨天通义万相首创生成汉字视频让AI创作者们沸腾了一波。今天，海螺AI又推出全新主体参考功能，让AI视频创作再上新台阶。用户只需上传一张图片，就能让任何人物角色在各种场…

七个圈

通义万相推2.1视频模型大幅提升复杂运动能力

通义万相推2.1视频模型大幅提升复杂运动能力

近日，阿里旗下的通义万相视频生成模型迎来了重磅升级，推出了全新的2.1版本。这一版本分为极速版与专业版，分别着重于高效性能和卓越表现力，为 AI 视频生成带来了新的突破。此次升级最引人注目的是模型在…

七个圈

Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景

Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景

Adobe Research与香港科技大学（HKUST）联合开发的人工智能系统——TransPixar，正在重新定义电影、游戏和交互式媒体中的视觉特效制作方式。这项技术突破性地解决了人工智能生成视频中…

七个圈

英伟达发布Groot Teleop 技术允许通过Apple Vision Pro来训练机器人

英伟达发布Groot Teleop 技术允许通过Apple Vision Pro来训练机器人

未来，人形机器人市场预计将达到380亿美元。为满足这一巨大的市场需求，尤其是在工业和制造领域，英伟达日前宣布推出一系列机器人基础模型、数据管道和仿真框架，以加速下一代人形机器人的开发。英伟达创始人兼…

七个圈

HeyGen推全新数字人技术集成Sora，演技超越真人

HeyGen推全新数字人技术集成Sora，演技超越真人

近日，HeyGen 公司宣布将其数字人模型与 OpenAI 的 Sora 模型实现集成，引发业界广泛关注。这一技术突破意味着，我们即将迎来前所未有的、由人工智能驱动的“会说话的虚拟形象”视频。这些虚拟…

七个圈

开源AI搜索网站MiniPerplx：由Gork驱动，支持搜索Twitter和YouTube内容

开源AI搜索网站MiniPerplx：由Gork驱动，支持搜索Twitter和YouTube内容

近日，一款名为MiniPerplx的开源AI搜索引擎正在技术圈引发热议。这款由Gork驱动的搜索工具不仅能够进行常规网页搜索，还创新性地整合了Twitter和YouTube内容的搜索功能，展现出了超乎…

七个圈

中文视觉语音开源模型VITA-1.5发布具备类GPT 4o高级语音和视觉能力

中文视觉语音开源模型VITA-1.5发布具备类GPT 4o高级语音和视觉能力

最近，多模态大型语言模型（MLLM）取得了显著进展，特别是在视觉和文本模态的集成方面。但随着人机交互的日益普及，语音模态的重要性也日益凸显，尤其是在多模态对话系统中。语音不仅是信息传输的关键媒介，还能…

七个圈

Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai Engineering 以其创新和奇特的机器人产品而闻名，尤其是其经典作品如 Amagami Ham Ham，这款机器人凭借其独特的功能——咬手指带来“有点愉悦的感觉”——曾引起广泛关注。…

七个圈

字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动近日开源了一项名为 LatentSync 的创新技术，该技术是一种基于音频条件的潜在扩散模型的端到端唇同步框架。这项技术无需任何中间运动表示，即可实现视频中人物唇部动作与音频的精准同步。与以往…

七个圈

Hugging Face 推出 SmolAgents：三行代码打造智能代理，简化AI开发

Hugging Face 推出 SmolAgents：三行代码打造智能代理，简化AI开发

在传统的AI开发中，构建智能代理一直是一项复杂且技术要求高的任务。开发人员需要处理API集成、环境配置、依赖项管理等多个繁琐的步骤，这使得构建智能代理既耗时又费力。然而，Hugging Face最近推…

七个圈

可灵AI深夜放大招！悄悄上线AI模特功能

可灵AI深夜放大招！悄悄上线AI模特功能

昨天晚上，可灵AI悄然推出了一项可能颠覆电商行业的新功能——AI模特。这项创新不仅在技术上实现了突破，更在商业应用上展现出巨大的潜力。它标志着电商行业在视觉呈现方式上，即将迎来一场深刻的变革。可灵A…

七个圈

字节开源 Midscene.js：AI驱动的E2E测试框架迎来突破

字节开源 Midscene.js：AI驱动的E2E测试框架迎来突破

随着人工智能技术的进步，E2E（端到端）测试领域迎来新一轮创新浪潮。字节跳动web-infra团队最新开源的Midscene和独立开发者推出的Shortest等工具，正在改变传统的测试方式。 Mids…

七个圈

Hume AI发布全能语音引擎OCTAVE：文本秒变真人声，克隆人格特征

Hume AI发布全能语音引擎OCTAVE：文本秒变真人声，克隆人格特征

人工智能语音领域再迎重大突破!Hume AI近日推出了一款名为OCTAVE的全新文本与语音引擎，该引擎能够仅凭简单的文本描述或一段5秒的语音录音，即可生成或克隆出逼真的语音和人格特质，为虚拟角色和人机…

七个圈

声控未来！全新AI模型Sketch2Sound仅凭声音模仿和文本提示，即可生成高品质音频

声控未来！全新AI模型Sketch2Sound仅凭声音模仿和文本提示，即可生成高品质音频

用一段简单的哼唱、一段节奏的敲击，就能让AI生成一段高品质的音乐或音效，这不再是幻想。一项名为Sketch2Sound的创新研究成果，展示了一种全新的AI模型，它可以通过声音模仿和文本提示来生成高质量…

七个圈

CAP4D：上传参考图即可生成高质量4D角色头像

CAP4D：上传参考图即可生成高质量4D角色头像

近日，来自多伦多大学及向量研究所的研究团队发布了 CAP4D 模型，这是一种基于形变多视角扩散模型（MMDM）的新技术，能够通过任意数量的参考图像生成逼真的4D 头像。该模型采用双阶段方法，首先利用…

七个圈

AI终于迈过这道槛！Livekit 开源模型精准识别“你是否说完”！

AI终于迈过这道槛！Livekit 开源模型精准识别“你是否说完”！

在人机对话的世界里，最让人头疼的莫过于——“你到底说完没”! 这句话看似简单，却成了无数语音助手和客服机器人迈不过去的一道坎儿。你是不是也经常遇到这种情况:你只是停顿了一下，想思考接下来要说什么，结…

七个圈

震惊！你的AI聊天对象竟然偷偷学会了“读心术”！—— INFP带你解锁双人对话新姿势

震惊！你的AI聊天对象竟然偷偷学会了“读心术”！—— INFP带你解锁双人对话新姿势

近日，一项名为INFP（Interactive， Natural， Flash and Person-generic）的新技术引起了广泛关注。这项技术旨在解决当前AI虚拟头像在双人对话中存在的互动不足…

七个圈

Adobe推出新AI工具可让声音设计师通过哼唱和模仿声音来创作音频

Adobe推出新AI工具可让声音设计师通过哼唱和模仿声音来创作音频

Adobe Research与西北大学联合开发出一项突破性的AI系统Sketch2Sound，该技术能将简单的人声模仿和文字描述转化为专业级音效，有望彻底改变声音设计行业的工作方式。该系统会分析语音…

七个圈

电商产品试穿神器！Krea AI新功能：几秒钟将真实产品添加到任何图像中

电商产品试穿神器！Krea AI新功能：几秒钟将真实产品添加到任何图像中

在最近的更新中，AI创意工具 Krea AI 宣布在Krea Editor推出了令人兴奋的新功能 —— 自定义训练。据官方介绍，该功能可以在在几秒钟内将真实产品添加到任何图像中，就像变魔术…

七个圈

秒级产品图像合成:Krea AI推出自定义训练功能

秒级产品图像合成:Krea AI推出自定义训练功能

Krea AI宣布在其编辑器平台Krea Editor推出自定义培训功能，让用户能够在几秒钟内将真实产品无缝添加到任何图像中。这一新功能的发布，将为电商商家、营销人员和内容创作者带来更高效的视觉内容制…

七个圈

Genesis Project震撼发布：颠覆性生成式物理引擎，构建4D动态真实世界

Genesis Project震撼发布：颠覆性生成式物理引擎，构建4D动态真实世界

近日，备受瞩目的Genesis Project正式发布，这款全新的生成式物理引擎旨在以最高的真实感模拟整个物理世界，为虚拟领域带来前所未有的沉浸式体验。核心亮点:速度惊人，效率卓越 Genesis …

七个圈

Domo AI发布v2v 5.0测试版：动漫变真人，视频编辑再升级

Domo AI发布v2v 5.0测试版：动漫变真人，视频编辑再升级

Domo AI近日发布了v2v 5. 0 测试版，其中最引人注目的新功能是推出了一个v2v真实模型。该模型可以实现视频的反向操作，即可以将动漫类型的视频转换为真人视频，给用户带来了前所未有的视觉体验。…

七个圈

重磅！OpenAI推超强o1模型API：音频费用狂降60% 增加函数调用、图像分析能力

重磅！OpenAI推超强o1模型API：音频费用狂降60% 增加函数调用、图像分析能力

OpenAI 近日推出了其 API 的全新版本 o1模型，命名为 “o1-2024-12-17”，此版本带来了多个激动人心的新功能，包括智能函数调用、支持 JSON 格式的结构化输出以及图像分析能力。…

七个圈

宇树科技重磅开源：机器人训练全套代码公开，加速行业创新

宇树科技重磅开源：机器人训练全套代码公开，加速行业创新

机器人公司宇树科技（Unitree）近日宣布，将全面开源其机器人训练的源代码，这一举措在业界引发广泛关注。此次开源内容包括强化学习(RL)训练代码，以及从模拟到模拟(Sim-to-Sim)和从模拟到现…

七个圈

贡献榜

贡献文章数

七个圈

七个圈

关注AI领域动态，传递精准资讯，助力读者洞悉AI行业的最新资讯。

创米

AI学习引路人，专注编写、收集整理AI知识，为学习者提供清晰、实用的学习内容。

AI情报

AI情报

向圈友们分享AIGC活动招募信息，共建内容，分享自己的学习心得、交流经验。

AI领航员

AI领航员

AI变现策略探索者，乐于向个人创业者分享AI技术如何助力创新与变现。