内容持续更新中
Krea推出最新模型Wan2.1,具有惊艳动态效果和深度理解复杂提示能力。用户免费体验AI视频技术的重大突破。
在视频生成领域,尽管近年来取得了显著的进展,但现有的生成模型仍然难以真实地捕捉到复杂的运动、动态和物理现象。这种局限性主要源于传统的像素重构目标,这种方法往往偏向于提高外观的真实感,而忽视了运动的一致…
Krea最近发布用 Deepseek R1 驱动的Krea chat功能,用户可以通过聊天直接调用Krea平台上的所有功能,而无需关注界面的具体操作。 通过Krea chat,用户能够轻松地与模型进行…
根据教育部《高等学校人工智能创新行动计划》部署要求,深入贯彻习近平总书记关于人工智能(AI)和数字中国的重要论述,天津职业技术师范大学汽车与交通学院教授宋裕庆在今年两会上带来的建议是《推动人工智能赋能…
近日,来自多伦多大学及向量研究所的研究团队发布了 CAP4D 模型,这是一种基于形变多视角扩散模型(MMDM)的新技术,能够通过任意数量的参考图像生成逼真的4D 头像。 该模型采用双阶段方法,首先利用…
在科技浪潮席卷全球的今天,人工智能正以前所未有的力量重塑着我们的生活方式。为引领学生紧跟科技步伐,山东省第五中学师生近日来到历下区人工智能教育示范中心,开展了科技教育实践活动。 该中心被称作“融合教育…
由华裔科学家、被称为“AI教母”的斯坦福大学教授李飞飞创办的AI创业公司World Labs于12月2日宣布向“空间智能”迈出第一步:从单张图像即可生成三维世界。这一人工智能系统可以让用户“进入任何图…
近日,研究人员提出了一种名为 JoyVASA 的新技术,旨在提升音频驱动的图像动画效果。随着深度学习和扩散模型的不断发展,音频驱动的人像动画在视频质量和嘴形同步精度方面取得了显著进展。然而,现有模型的…
放射检查在诊疗行为中扮演重要角色,近日,为统一整合规范放射检查项目,推动放射检查价格趋于合理,国家医保局印发《放射检查类医疗服务价格项目立项指南(试行)》。指南将放射检查类价格项目整合为26项,同时对…
近年来,人工智能(AI)技术在电力行业的应用日益广泛,推动了电力系统的智能化转型。特别是在输电线路巡视缺陷识别领域取得了重大突破,实现了对输电线路缺陷的智能识别和预警,有效提升了电网的安全水平。 输电…
11月7日消息,微软推出了记事本软件,如今为其添加了名为“Rewrite”的AI文本编辑功能,可在Windows Insiders中进行预览。Rewrite允许用户通过AI“改写句子、调整语气和修改内…
知名 AI 视觉内容创作平台 Haiper 宣布推出 Haiper2.0版本,距离该模型首次发布仅七个月。此次重大升级承诺以更快的速度生成超逼真视频,与 OpenAI 的 Sora 不同,Haiper…
近日,卡内基梅隆大学的研究团队发布了一项名为 “DressRecon” 的新技术,旨在通过单目视频重建时间一致的人体模型。DressRecon的厉害之处在于,不仅输入视频就能实现构建出3D模型,并它还…
9月19日,2024年行业集体路演半导体专场在上交所举行。韦尔股份、闻泰科技、彩虹股份、新洁能、乐鑫科技、东芯股份等半导体细分领域龙头公司纷纷亮相,介绍上半年业绩,与投资者畅聊对下半年的乐观展望。在互…
创意表达总是受限于技术,但Luma v1.5版本的问世,让视频生成的艺术迈向了新纪元。 Luma v1.5版本在视频生成方面取得了显著进步,不仅提升了视频的质量,更缩短了生成时间。现在,你可以在更短的…
“奥库斯”在最新测试中集成了人工智能与无人机技术,旨在提升多战场作战能力。美英澳三国协调开发的新技术将增强军事响应速度,并对抗印太地区的威胁。
在图像处理领域,抠图——也就是将图像中的前景对象从背景中分离出来的技术——一直是一个挑战。现在,一种名为“Matting by Generation”的新技术,正在用生成模型重新定义抠图的精准度和效率…
深圳市南山区海上世界文化艺术中心举办的《过化存神》展览汇集了陈育强、徐沛之等多位艺术家,以人工智能协作的作品探索艺术创作的新可能性。展览通过人工智能处理网络图像、学习传统绘画技巧及分析艺术家风格,挑战数字化时代下艺术的边界,展示其在创作过程中的角色。
李飞飞创办的新公司World Labs估值突破10亿美元,致力于使AI在三维世界理解方面取得突破。公司由Andreessen Horowitz和Radical Ventures支持,专注于视觉数据处理和高级推理。
腾讯科技报道,中文多模态大模型SuperCLUE-V基准8月榜单揭晓,腾讯混元模型以71.95分稳居首位。测评覆盖12个国内外多模态理解大模型,揭示了国内模型在细粒度视觉认知任务上与海外模型的差距。
在本周举行的SIGGRAPH大会上,Meta首席执行官马克·扎克伯格首次展示了Segment Anything2(SA2),这是该公司去年推出的突破性图像分割模型的升级版本。新模型将AI驱…
最近,LensGo AI推出了新功能——FaceSync。FaceSync功能的核心在于其能够将用户的表演视频与所选择的图片或视频同步,创造出一种全新的视觉体验。用户可以录制自己的表演,然后挑选一张图…
快手公司旗下的视频生成大模型“可灵”近期推出了两项全新功能:“图生视频”和“视频续写”,进一步丰富了用户的视频创作工具箱。 “图生视频”功能允许用户上传任意图片,快速生成一段5秒的精彩视频。这一功能不…
OpenAI的ChatGPT出现重大故障,用户遭遇应答异常频繁事件。媒体报道指出,在美国和英国,ChatGPT移动端和网页版时不时无法应答用户的提问。OpenAI已确认问题并进行处理,现已恢复全部系统正常运行。本文将分享OpenAI故障率偏高问题的解决方法。
Hallo允许通过单张图像和音频输入生成唱歌和说话的视频,同时还能控制视频中人物的表情和姿态。这项技术基于扩散模型的层次化音频驱动视觉合成方法,旨在提升语音输入与生成动画之间的对齐精度,包括嘴唇、表情…
美国初创公司 Luma AI 推出梦幻机(Dream Machine)文本生成视频工具,挑战市场竞争对手如OpenAI的Sora和快手的可灵(KLING)。梦幻机具备快速生成高质量视频的能力,虽然存在一定限制,但展示了潜力。梦幻机为文本生成视频技术注入新活力,有望在未来取得重要地位。
北约官员透露北约利用人工智能对抗俄罗斯,分析卫星图像追踪飞机和加油站,乌克兰试验无人机人工智能应用。北约拟扩大与乌克兰国防技术合作,分享俄罗斯电子战能力情报,引入信息共享框架。俄罗斯发展新技术躲避无人机声音传感器。
3月23日,记者从华中科技大学获悉,由该校联合武汉金山办公软件有限公司研究人员开发的Monkey多模态大模型已被人工智能领域国际顶级会议CVPR2024接收,且该大模型曾在大模型开源开放评测体系——“…