图像相关资讯及图像相关产品

市人大代表宋裕庆：让职业教育“拥抱”人工智能

根据教育部《高等学校人工智能创新行动计划》部署要求，深入贯彻习近平总书记关于人工智能（AI）和数字中国的重要论述，天津职业技术师范大学汽车与交通学院教授宋裕庆在今年两会上带来的建议是《推动人工智能赋能…

CAP4D：上传参考图即可生成高质量4D角色头像

近日，来自多伦多大学及向量研究所的研究团队发布了 CAP4D 模型，这是一种基于形变多视角扩散模型（MMDM）的新技术，能够通过任意数量的参考图像生成逼真的4D 头像。该模型采用双阶段方法，首先利用…

逐梦科技星辰，共绘人工智能画卷——济南五中开展科技教育实践活动

在科技浪潮席卷全球的今天，人工智能正以前所未有的力量重塑着我们的生活方式。为引领学生紧跟科技步伐，山东省第五中学师生近日来到历下区人工智能教育示范中心，开展了科技教育实践活动。该中心被称作“融合教育…

AI活动

“AI教母”李飞飞创业公司公布“空间智能”成果：单张图像生成三维世界

由华裔科学家、被称为“AI教母”的斯坦福大学教授李飞飞创办的AI创业公司World Labs于12月2日宣布向“空间智能”迈出第一步：从单张图像即可生成三维世界。这一人工智能系统可以让用户“进入任何图…

音频驱动生成面部视频技术JoyVASA 支持小动物角色

近日，研究人员提出了一种名为 JoyVASA 的新技术，旨在提升音频驱动的图像动画效果。随着深度学习和扩散模型的不断发展，音频驱动的人像动画在视频质量和嘴形同步精度方面取得了显著进展。然而，现有模型的…

“放射检查类”服务价格立项指南出炉：人工智能云图像首度被纳入价格构成

放射检查在诊疗行为中扮演重要角色，近日，为统一整合规范放射检查项目，推动放射检查价格趋于合理，国家医保局印发《放射检查类医疗服务价格项目立项指南（试行）》。指南将放射检查类价格项目整合为26项，同时对…

国网克州供电公司：人工智能赋能输电线路巡视缺陷识别应用

近年来，人工智能（AI）技术在电力行业的应用日益广泛，推动了电力系统的智能化转型。特别是在输电线路巡视缺陷识别领域取得了重大突破，实现了对输电线路缺陷的智能识别和预警，有效提升了电网的安全水平。输电…

阅读量飙升微软在记事本中引入AI文本编辑功能

11月7日消息，微软推出了记事本软件，如今为其添加了名为“Rewrite”的AI文本编辑功能，可在Windows Insiders中进行预览。Rewrite允许用户通过AI“改写句子、调整语气和修改内…

新鲜出炉，等待你的评论

阅读量飙升 Haiper 2.0 发布：新增视频模板功能，静态图像秒变视频！

知名 AI 视觉内容创作平台 Haiper 宣布推出 Haiper2.0版本，距离该模型首次发布仅七个月。此次重大升级承诺以更快的速度生成超逼真视频，与 OpenAI 的 Sora 不同，Haiper…

新鲜出炉，等待你的评论

DressRecon:输入视频就能构建出还原服装细节的3D模型

近日，卡内基梅隆大学的研究团队发布了一项名为 “DressRecon” 的新技术，旨在通过单目视频重建时间一致的人体模型。DressRecon的厉害之处在于，不仅输入视频就能实现构建出3D模型，并它还…

阅读量飙升受益于AI 看好下半年趋势半导体龙头公司集体路演亮点纷呈

9月19日，2024年行业集体路演半导体专场在上交所举行。韦尔股份、闻泰科技、彩虹股份、新洁能、乐鑫科技、东芯股份等半导体细分领域龙头公司纷纷亮相，介绍上半年业绩，与投资者畅聊对下半年的乐观展望。在互…

新鲜出炉，等待你的评论

挑战Sora！Luma v1.5版本发布更快、更真、更清晰

创意表达总是受限于技术，但Luma v1.5版本的问世，让视频生成的艺术迈向了新纪元。 Luma v1.5版本在视频生成方面取得了显著进步，不仅提升了视频的质量，更缩短了生成时间。现在，你可以在更短的…

阅读量飙升奥库斯测试最新AI作战工具：美英澳联合推动人工智能防御系统

“奥库斯”在最新测试中集成了人工智能与无人机技术，旨在提升多战场作战能力。美英澳三国协调开发的新技术将增强军事响应速度，并对抗印太地区的威胁。

新鲜出炉，等待你的评论

全新抠图方法Matting by Generation 自动抠图无需额外输入

在图像处理领域，抠图——也就是将图像中的前景对象从背景中分离出来的技术——一直是一个挑战。现在，一种名为“Matting by Generation”的新技术，正在用生成模型重新定义抠图的精准度和效率…

人工智能拓展艺术创作的可能性，《过化存神》深圳展览引发市民探索

深圳市南山区海上世界文化艺术中心举办的《过化存神》展览汇集了陈育强、徐沛之等多位艺术家，以人工智能协作的作品探索艺术创作的新可能性。展览通过人工智能处理网络图像、学习传统绘画技巧及分析艺术家风格，挑战数字化时代下艺术的边界，展示其在创作过程中的角色。

“AI教母”李飞飞新公司估值10亿美元，AI理解三维世界

李飞飞创办的新公司World Labs估值突破10亿美元，致力于使AI在三维世界理解方面取得突破。公司由Andreessen Horowitz和Radical Ventures支持，专注于视觉数据处理和高级推理。

中文多模态大模型SuperCLUE-V基准8月榜单发布，腾讯混元居首

腾讯科技报道，中文多模态大模型SuperCLUE-V基准8月榜单揭晓，腾讯混元模型以71.95分稳居首位。测评覆盖12个国内外多模态理解大模型，揭示了国内模型在细粒度视觉认知任务上与海外模型的差距。

Meta推出Segment Anything 2: AI视频分割技术取得重大突破

在本周举行的SIGGRAPH大会上，Meta首席执行官马克·扎克伯格首次展示了Segment Anything2（SA2），这是该公司去年推出的突破性图像分割模型的升级版本。新模型将AI驱…

阅读量飙升 LensGo AI推FaceSync功能可将你的声音和口型转移到目标图像

最近，LensGo AI推出了新功能——FaceSync。FaceSync功能的核心在于其能够将用户的表演视频与所选择的图片或视频同步，创造出一种全新的视觉体验。用户可以录制自己的表演，然后挑选一张图…

新鲜出炉，等待你的评论

可灵上线图生视频和视频续写功能最长可生成3分钟视频

快手公司旗下的视频生成大模型“可灵”近期推出了两项全新功能:“图生视频”和“视频续写”，进一步丰富了用户的视频创作工具箱。 “图生视频”功能允许用户上传任意图片，快速生成一段5秒的精彩视频。这一功能不…

阅读量飙升 ChatGPT重大故障！OpenAI应答异常频繁事件解决方法分享

OpenAI的ChatGPT出现重大故障，用户遭遇应答异常频繁事件。媒体报道指出，在美国和英国，ChatGPT移动端和网页版时不时无法应答用户的提问。OpenAI已确认问题并进行处理，现已恢复全部系统正常运行。本文将分享OpenAI故障率偏高问题的解决方法。

新鲜出炉，等待你的评论

阅读量飙升新对口型视频项目Hallo发布可对表情，嘴型进行精确控制

Hallo允许通过单张图像和音频输入生成唱歌和说话的视频，同时还能控制视频中人物的表情和姿态。这项技术基于扩散模型的层次化音频驱动视觉合成方法，旨在提升语音输入与生成动画之间的对齐精度，包括嘴唇、表情…

新鲜出炉，等待你的评论

Luma AI梦幻机火爆上线：绝对秒杀Sora和快手可灵

美国初创公司 Luma AI 推出梦幻机（Dream Machine）文本生成视频工具，挑战市场竞争对手如OpenAI的Sora和快手的可灵（KLING）。梦幻机具备快速生成高质量视频的能力，虽然存在一定限制，但展示了潜力。梦幻机为文本生成视频技术注入新活力，有望在未来取得重要地位。

阅读量飙升北约官员披露：人工智能应用于对抗俄罗斯的最新战略

北约官员透露北约利用人工智能对抗俄罗斯，分析卫星图像追踪飞机和加油站，乌克兰试验无人机人工智能应用。北约拟扩大与乌克兰国防技术合作，分享俄罗斯电子战能力情报，引入信息共享框架。俄罗斯发展新技术躲避无人机声音传感器。

新鲜出炉，等待你的评论

阅读量飙升 Monkey在文档领域的“升级版”——文字多模态大模型TextMonkey也于近日发布

3月23日，记者从华中科技大学获悉，由该校联合武汉金山办公软件有限公司研究人员开发的Monkey多模态大模型已被人工智能领域国际顶级会议CVPR2024接收，且该大模型曾在大模型开源开放评测体系——“…

新鲜出炉，等待你的评论