设为首页 加入收藏
  • 首页
  • 探索
  • 休闲
  • 知识
  • 焦点
  • 热门资讯
  • 时尚
  • 当前位置:首页 > 综合 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    财经观察:提升人机交互效率 多模态大模型易用性进一步推进

    发布时间:2025-12-07 05:28:29 来源:营口市某某电子打标设备教育中心 作者:时尚

    人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态郑州市某某酸菜鱼专卖店问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

    北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经郑州市某某酸菜鱼专卖店音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

    一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

    模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

    作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

    发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

    米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

    此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

    国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

    多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

    米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

    据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

    OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

    • 上一篇:10次!中国文昌航天发射场年发射量首次达到两位数
    • 下一篇:泽连斯基:乌美正筹备新一轮会谈

      相关文章

    • 斐济前总理因妨碍司法公正被判入狱一年
    • 哈啰顺风车:五一假期顺风车出行需求达4320万单
    • 点亮“音乐的河”,上海音乐学院策划中法文化交流季
    • 收评:沪指窄幅震荡涨0.22% 两市成交额跌破万亿
    • 被山寨的雷军和周鸿祎,背后都是生意
    • AI赛道再发力!苹果(AAPL.US)正为数据中心开发自研AI芯片
    • 贾跃亭:考虑任FF联席CEO,采取所有可行措施保卫上市资格
    • 福建舰大船出海,我们一直在进步!
    • 俄罗斯内务部将3名乌克兰前政要列入通缉名单
    • 谁在拍摄前线图像?以军新型士兵曝光:先接受特殊摄影训练,再上战场

      • 才十年!周润发从意气风发到满头白发,这断崖式衰老太扎心了
      • 粥香情浓赏民俗 海淀苏家坨镇举办立夏习俗活动
      • 金店遇冷!有店主说从业20年这个五一假期生意最淡
      • 12年来再次四大皆空,拜仁把应聘者都吓跑了?
      • 学习新语|中法元首外交再写佳话
      • 天下奇观,莫斯科办展,美英请先看!
      • 静安戏剧谷|香港绿叶剧团用武打肢体剧讲述江湖传奇
      • 静安戏剧谷|人偶同台,南非木偶剧团演绎库切小说
      • 怼同行顺便怼老板?理想高管批理想ONE质保策略,一众车企躺枪
      • “卷王”打工人如何破局?请看《一仆二主》 现代版

        随便看看

      • 新雪季开启!新手也能放心冲的滑雪安全指南来了
      • 为何一季度净利增速低于营收增速?是否继续推进直销?贵州茅台逐一回应
      • 北京海关缉私局连破两起走私烟草案
      • 北京:七大火车站加强返程服务 多条地铁延时运营
      • 俞敏洪在南极旅游发全员信引争议,有新东方员工称“无法共情”
      • 杭州通报“叫花鸡里没有鸡”
      • 北京:5月6日早高峰部分地区有阵雨,短时可达严重拥堵状态
      • 通缉泽连斯基,俄罗斯有何用意?
      • 心理咨询不是“万能药” 4个常见误解要注意
      • 专家:哮喘疾病总体控制率不佳多源自民众认知不足
      wk0ev.2ptm7.llhgr.eap2x.wpf5p.hdup.0n7ae.wp2s2.akem.dslgw.aln.laoying.sbs 为拯救造车梦,贾跃亭甘愿做网红 假期港股涨这么多,明天该大A表现了?来看这篇深度分析 亚马逊云科技陈晓建:企业需要的是懂业务懂用户的AI iPhone比不过OPPO?苹果手机销量跌出前五!大中华区收入降13% 这一轮行情远超你想象,杨德龙惊人言论... 难忘一夜!余隆+王健,香港管弦乐团声动上海滩 玩转城市体育节丨街头风混搭国潮风,非遗市集等你来 福特每卖一辆电动汽车亏13万美元?福特这是怎么了? 法官在谷歌反垄断结案陈词中质疑:很奇怪没有人挑战谷歌 远超想象?“股神”巴菲特的AI投资布局
      • Copyright © 2025 Powered by 财经观察:提升人机交互效率 多模态大模型易用性进一步推进,营口市某某电子打标设备教育中心   sitemap