内容持续更新中
捷克布拉格技术大学和瑞士苏黎世联邦理工学院的研究团队最近推出了一种名为"WildGaussians"的创新方法,该方法显著提升了3D高斯溅射(3DGS)技术在处理非结构化图像集时的…
最近,Haiper AI更新视频模型,现在用户可以生成8秒时长的视频了,而且还可以通过超分工具进一步提升视频分辨率。能够生成更长的视频意味着用户可以创作更加复杂和丰富的故事线,增加内容的吸引力。 虽然…
在当今快速发展的人工智能领域,小型语言模型(LLMs)正变得越来越重要。它们不仅能够在消费级硬件上高效运行,还能支持完全离线的应用场景。H2O.ai 团队自豪地推出了 H2O-Danube3,一系列小…
在数字创作的神奇世界里,想象一下,你能够轻松地将一张图片中的主题拖放到另一张风格迥异的背景图中,并且让这个主题完美地融入新环境,既保留了它的个性,又与新背景的风格无缝对接。这听起来像魔法,但这就是Ma…
在这个AI大爆炸的时代,大型语言模型(LLMs)已经成为推动机器学习应用的超级引擎。但是,训练这些庞然大物需要巨大的计算资源。想象一下,如果我们能在世界各地分散的设备上,高效地训练这些模型,那将会怎样…
在科技的江湖里,Google DeepMind又扔出了一个重磅炸弹——他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力,简直就是给机…
最近,AI照片“复活术”,在网络上掀起了不小的波澜,Heygen终于也按耐不住,开始推对口型工具了。 你只需要上传一张照片和一段音频,照片中的人物就能根据音频内容开始说话、唱歌,甚至是朗读。而且,它目…
三星电子在可穿戴设备领域又迈出了创新的一步,这次他们带来的是全新的Galaxy Ring智能戒指,以及Galaxy Watch7和Galaxy Watch Ultra。这不仅是科技的一次飞跃,更是将G…
在无人车技术领域崭露头角的团队,如今跨足好莱坞,为大家带来一项革命性的电影级视觉AI特效——Odyssey。说白了,这团队是要用AI颠覆电影、电视节目和视频游戏的制作方式。 效果如何,直接看视频吧: …
最近,Mentee Robotics公司发布了一段关于其人形机器人MenteeBot的最新视频。这款机器人不仅能跟随人类在新环境中自由导航,还能灵巧地避开障碍物,并根据指令进行各种动作和姿态调整。 早…
加州大学圣地亚哥分校和麻省理工学院的研究员们搞了一个叫Open-TeleVision的项目,听起来有点酷炫。这个玩意儿是一种开源的远程操作系统,号称能让你从3000英里外轻松操控机器人,还能精准地玩弄…
LivePortrait,这个名字听起来就像是魔法,但它其实是现实世界中的黑科技。想象一下,你那尘封已久的相册里,那些定格在时间里的笑脸,突然间动了起来,眨眼、微笑、甚至说话,这不再是电影里的场景,L…
今天,ElevenLabs给我们带来了一个让音频爱好者们兴奋不已的新产品——VOICE ISOLATOR,一款能够"消音"的神奇工具。它不仅能消除不需要的背景噪音,还能从任何音频中…
MimicMotion最近推出了一项令人瞩目的新技术,名为“High-Quality Human Motion Video Generation with Confidence-aware Pose …
法国开源AI研究实验室Kyutai发布了一款全新的多模态大模型Moshi。这不仅仅是一个技术突破,更是对现有AI技术的一次大胆挑战。 7月4日凌晨,Kyutai在官网宣布了Moshi的到来。这款模型的…
Perplexity近日宣布对其Pro Search服务进行重大升级,这一举措将彻底改变人们进行研究和信息检索的方式。新版Pro Search不仅能处理更复杂的查询,还具备多步推理能力,为用户提供更深…
近日,研究人员发布了一项名为 Meta3D Gen(3DGen)的全新、快速的文本生成3D 模型的技术,3D Gen 通过高效的方式创建3D 模型,具有高质量的纹理和材质,为用户带来了全新的体验。 这…
Fish Speech是一款由fishaudio开发的全新文本转语音工具,它不仅完美支持中文、英语和日语,而且在语音处理上的能力接近人类水平,可以说是你私人语音助手的不二之选。 要点: 😊 完美支持中…
快手公司旗下的视频生成大模型“可灵”近期推出了两项全新功能:“图生视频”和“视频续写”,进一步丰富了用户的视频创作工具箱。 “图生视频”功能允许用户上传任意图片,快速生成一段5秒的精彩视频。这一功能不…
环球音乐集团(UMG)与AI音乐技术公司SoundLabs强强联手,为歌手和艺术家们带来了一项革命性的技术——定制自己的语音克隆模型。这不是科幻,这是现实! 通过SoundLabs的MicDrop功能…
TikTok推出了一项名为Symphony的AI内容工具套件,旨在彻底改变我们创作和分享内容的方式。这个套件不仅简化了内容创作过程,还大幅提升了创作质量,使每个人都能成为创意大师。 Symphony …
最近,Hedra Labs推出了Character-1的研究预览版,该技术允许用户根据任意人物照片和语音内容生成个人说话和唱歌的动态视频。 想象一下,你上传一张人物照片,再配上任意的语音内容,瞬间就能…
Luma AI公司发布预告,其最新产品Dream Machine将推出强大的编辑功能和更直观的控制界面,旨在为用户提供前所未有的视频编辑体验。 用户通过Dream Machine可以轻松进行各种复杂的…
Runway最近推出了新一代视频生成模型Gen-3Alpha,这一模型在保真度、一致性和动作表现方面都有重大改进,为构建通用世界模型迈出了重要一步。Gen-3Alpha具备多项显著的功能和特点,使其成…
Luma官方最近发布了他们备受期待的视频生成模型Dream Machine的介绍视频,展示了该模型的多项突出特点和能力。这款AI视频生成工具不仅向所有用户免费开放,还提供了高质量的视频输出,分辨率高达…