内容持续更新中
3D设计领域迎来重大突破,初创公司Meshy今日发布了最新版本的建模工具Meshy-4。这款工具经过16个月的精心开发,旨在彻底改变设计师和开发人员创建虚拟环境的方式。 Meshy联合创始人Ethan…
特斯拉正在寻找一些特别的"动作演员",不过他们不是去拍电影,而是穿上动作捕捉服来训练特斯拉的人形机器人Optimus。这个职位被称为"数据采集操作员",他们将通…
近日,Adobe 推出了一款名为 “Magic Fixup(魔法修复)”的人工智能照片编辑工具,宣称将彻底改变我们处理图片的方式。这个新技术能够自动进行复杂的图像调整,同时又能保留创作的艺术意图,这无…
想象一下,如果你只需动动嘴,就能瞬间改变照片中的任何细节,那会是一种怎样的体验?Adobe Research团队开发的TurboEdit工具,正让这种神奇的体验成为现实。 TurboEdit是一款基于…
创意表达总是受限于技术,但Luma v1.5版本的问世,让视频生成的艺术迈向了新纪元。 Luma v1.5版本在视频生成方面取得了显著进步,不仅提升了视频的质量,更缩短了生成时间。现在,你可以在更短的…
最近,一个叫Tavus的创业小分队推出了一款堪称"神器"的视频聊天AI,瞬间在科技圈掀起了轩然大波!这个名叫"Conversational Replicas by Tav…
Midjourney,这个曾经在AI绘图领域独领风骚的平台,终于对其饱受诟病的网页版图像编辑功能进行了大刀阔斧的改革。今天,Midjourney官方推出了一个全新的网络编辑器,将之前分散的多项图像操作…
你是否曾在拍集体照时,因为要担任摄影师而感到一丝失落,遗憾自己不能出现在镜头里?或者你已经在集体照中,却想让拍照的人也能加入,却发现这几乎不可能实现?现在,谷歌解决了这个问题。 在今年的Made By…
数字助手已经成为我们生活中的重要伙伴,而谷歌的Gemini Live的推出,将这种便捷性提升到了新的高度。借助生成式AI的力量,Gemini Live不仅能够理解我们的需求,还能以更自然、更人性化的方…
随着科技的不断进步,人工智能已经不仅仅是一个冷冰冰的机器,它正在变得越来越像我们人类。想象一下,当你的智能助手不仅能说一口流利的普通话,还能用你熟悉的家乡话与你交流,那将是一种多么亲切的体验。Bail…
Genie,一款由Cosine公司发布的AI程序员,它在权威测试平台SWE-Bench上的评分高达30.08%,以断崖式的优势领先于Devin的13.8%和Swe-agent+GPT-4的12.47%…
最近,北京亦庄的一家“健身房”里,一款名为“天工”的人形机器人,以其卓越的运动能力,成为了科技界的新宠。 这款由北京具身智能机器人创新中心研发的机器人,不仅在跑步机上轻松跑出每小时6公里的速度,还能在…
清华大学、百度和南洋理工大学S-Lab实验室联合开发了一种新型的多功能AI框架——ReSyncer,它在视频合成技术领域取得了显著的突破。ReSyncer能够生成与音频高度同步的逼真口型视频,同时具备…
巴黎奥运会还在如火如荼的进行中,乒乓球比赛的激烈角逐让人在场的人忍不住屏住呼吸。这不,连谷歌都忍不住要申请出战,发布了首个达到人类竞技水平的机器人Agent。 乒乓球作为一项需要多年训练才能精通的运动…
在中国机器人技术的舞台上,一家名为「逐际动力(LimX Dynamics)」的公司正以其最新的人形机器人CL-1吸引全球的目光。这款机器人在最新发布的视频中展示了其在多样化的地形条件下自主行走和执行任…
近日,AI公司Mistral终于开始补齐其他开发者工具,除了推出新的La Plateforme,还发布了Agents平台和更新了SDK,为用户和开发者提供更强大、更灵活的AI模型优化和应用能力。 Mi…
在数字化时代,虚拟现实(VR)和增强现实(AR)技术正逐步改变我们的生活和工作方式。设想一下,如果能够创建一个能模仿你每一个动作和表情的3D化身,那是怎样的体验? 由DGIST和Meta公司的Code…
在图像处理领域,抠图——也就是将图像中的前景对象从背景中分离出来的技术——一直是一个挑战。现在,一种名为“Matting by Generation”的新技术,正在用生成模型重新定义抠图的精准度和效率…
近日,一项名为EmoTalk3D的前沿技术项目在人工智能领域引起了广泛关注。该项目通过引入一个包含校准的多视图视频、情感标注及每帧3D几何图形的数据集——EmoTalk3D数据集,成功实现了在高保真度…
智能机器人领域的新秀Figure公司日前推出了其最新力作——Figure02机器人。这款集多项尖端技术于一身的智能机器人,不仅标志着AI技术的又一重大突破,更预示着人机交互即将迈入一个全新的时代。 据…
今天,即梦宣布上线动效画板功能,允许用户精确地控制视频中物体的运动轨迹与结束状态。这意味着,你可以更好地控制视频内物体的运动轨迹,有效控制视频的输出质量。 动效画板的核心功能: 支持框选或手动选择背景…
近日,上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称,这款模型可以边听边说,效果非常好,接近人类自然的对话方式。 LSLM被称为“小L”,解决了现有语音模型在实时…
Runway在AI生成视频的快速演进领域又迈出了重要一步。该公司宣布,其Gen-3Alpha图像到视频工具现在支持将图像用作视频生成的首帧或尾帧,这一功能可能会显著提高电影制片人、市场营销人员和内容创…
LlamaCoder,这个基于Llama3.1405B模型的平台,正在彻底改变我们对应用程序开发的认知,为开发者们带来前所未有的效率提升和创新可能。 LlamaCoder的核心优势在于其强大的自动化能…
继OpenAI的Sora震惊世界后,阿里巴巴的研究团队再次为我们带来了惊喜 – Tora,这个基于轨迹的视频生成新星,正在悄然改变我们对AI视频创作的认知。 主要特点: 高保真度:Tora…