揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

随着科技的不断发展,人工智能不仅在商业领域取得了巨大成功,也在公益事业中展现了强大的潜力。一部名为《听见世界》的公益短片在社交媒体上引起了关注,它不仅让观众感受到深刻的情感共鸣,还展示了复旦眸思大模型如何借助AI科技为视障者打破视觉界限的努力。目前,听见世界APP已经上线,盲人朋友可以在安卓商店进

随着科技的不断发展,人工智能不仅在商业领域取得了巨大成功,也在公益事业中展现了强大的潜力。一部名为《听见世界》的公益短片在社交媒体上引起了关注,它不仅让观众感受到深刻的情感共鸣,还展示了复旦眸思大模型如何借助AI科技为视障者打破视觉界限的努力。

目前,听见世界APP已经上线,盲人朋友可以在安卓商店进行应用下载。为揭开听见世界项目的神秘面纱,我们对复旦眸思公益助盲项目团队进行了专访。

源起:复旦眸思大模型,助力产品打破视觉界限

“在多模态大模型开发过程中,我们一直在探讨利用多模态大模型能具体做些什么。我们在眸思多模态大模型构建过程中使用了数亿张图片进行训练,其中有大量的自然场景,在测试过程中,我们发现它可以非常好地对自然环境,甚至是可以对非常罕见的自然场景进行准确描述,”中工互联首席科学家、复旦大学计算机学院教授张奇讲道:“我们觉得这就像是机器长了眼睛。由此,我们很快想到将图像转换为语音,可以为盲人朋友在行走、寻找物品等场景下提供巨大的帮助。”

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:听见世界项目研发团队部分成员

显而易见,复旦眸思大模型成为了听见世界APP运行的基石。

张奇教授表示:眸思大模型提出了全新的多视觉专家混合架构。它将擅长图文匹配、光学字符识别(OCR)和图像分割等多种经典视觉任务的专家巧妙地融为一体。在各类场景中,眸思大模型展现出良好的性能和逻辑推理能力。

中工互联(北京)科技集团有限公司创始人、董事长智振讲道:“眸思大模型是复旦大学NLP实验室的最新力作,代表国内科研机构*进的技术水平。听见世界APP的表现非常惊艳。长远来看,随着人工智能技术的进步和未来脑机接口技术的突破,可能盲人朋友真就能‘看到’世界了。要实现这一长远的目标,需要全世界科技工作者共同的努力。”

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:中工互联董事长智振

推进:项目研发团队,产学研用强强联合

复旦大学自然语言处理实验室与复旦大学视觉与学习实验室在开发复旦眸思多模态大模型时就同步进行了听见世界项目的开发工作。该项目由复旦大学桂韬、纪焘、张奇、黄萱菁、邱锡鹏、吴祖煊、姜育刚等主导,樊晓然、江常皓、李烁、金森杰等近20名博士和硕士研究生共同参与了产品研发。

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:张奇教授

“中工互联在整个项目的研发过程中给予了全方位的支持,”张奇教授讲道:“我们之间建立了良好的战略合作关系,在中工互联擅长的工业领域,我们一起利用多模态大模型,在图纸理解、产品质检和异常检测等领域开展了广泛的产品落地。”

智振董事长表示:中工互联复旦大学联合实验室,以及智工·工业大模型研发团队全程参与了项目研发。项目团队由*大学科研队伍和务实的产品落地成员组成。既有创新精神又可以高效快速落地。这种能力在智工工业大模型的研发中得以展现。

应用:我是你的眼,世界就在你耳边

听见世界APP采用安卓系统进行开发,可以支持*端的智能手机。在后端模型架构层面,研发团队采用了非常灵活的部署策略,可以使用智算中心的闲置算力,甚至是居民个人家庭中3090显卡的闲置时间。

听见世界APP的全部识别功能都全部来源于眸思大模型,在不同的模式下预设了不同的Prompt,从而方便盲人朋友使用。

据悉,听见世界APP产品目前设计了街道行走、物品寻找、自由问答和电视介绍等四种模式。它可以成为视障人士的生活助手与智能管家。

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:听见世界APP电视介绍模式

举个例子。当盲人朋友开启街道行走模式,听见世界APP会通过摄像头实时捕捉交通画面,并将画面传递给复旦眸思大模型,由模型识别当前场景中的情况,并对红绿灯、路口、台阶、坡道等信息进行重点识别,进而生成文字并合成语音,播放给盲人朋友。

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:听见世界APP街道行走模式

“其他模式与这个类似,都是通过摄像头捕捉图像,盲人朋友通过语音与模型进行交互,从而得到整体结果,”张奇教授讲道:“未来,我们会围绕盲人的衣食住用行等方方面面的需求,全面完善产品功能。让听见世界APP真正变成盲人的朋友的‘眼睛’。”

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:听见世界APP物品寻找模式

智振董事长表示:听见世界APP,我们为它找到了一个产品推广语——我是你的眼,世界就在你耳边。这款产品既可以成为盲人朋友生活的必备工具,让他们和正常人一样感受到世界的美好。

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:听见世界APP可以实现实时交互

未来:定位公益项目,让每一份生活都更美好

关于听见世界APP产品应用成本,研发团队曾经算过一笔账。

张奇教授分析道:在大模型层面,我们目前有80亿、140亿和350亿等三个参数版本。即便采用80亿参数的版本,一个终端每小时所消耗的GPU计算费用在1元左右,估算下来,服务每个盲人朋友每个月大约需要150元左右。但是,我们希望尽*努力,协调各方资源,将这个产品免费提供给盲人朋友。

张奇教授表示:“在政府的支持下,我们计划与NGO组织、智算中心和硬件厂商等开展合作,致力于让盲人朋友免费使用产品和相关的服务。”

揭秘听见世界APP:人工智能公益助盲,复旦眸思大模型打破视觉界限_行业动态

图:复旦大学NLP实验室青年副研究员桂韬

“在人工智能引领的时代潮流中,我们不应该忽视任何一个人,眸思项目能够帮助1800万盲人重新找回生活的色彩,这不仅是技术的一次飞跃,也是人工智能在服务人类,改善我们生活方面道出的重要一步,”复旦大学自然语言处理实验室青年副研究员桂韬表示:“这代表着我们实验室对于打造一个更加包容、更加美好世界的坚定承诺。”

“人工智能等一切科技文明都是人类集体智慧的结晶,我们需要在科技的发展中寻求更多的公正和平等。听见世界,我们对它的定位是公益项目,”智振董事长讲道:“与此同时,我们会加快眸思大模型的商业化落地进程,尽快惠及更多行业更多用户。我们计划在复旦大学中工互联联合实验室的框架内,加大科研经费的投入,首期计划投入1500万研发经费来加大基础大模型的研究。”

(0)
小多多的头像小多多创始人

相关推荐

  • 阿胶净利跌96%的原因(专家分析怎么回事)

    东阿阿胶净利跌96%,曾被誉为“美容圣品”的阿胶如今风头似乎正在逐渐消退。 2019年10月30日晚间,东阿阿胶披露了2019年第三季度报告。在今年第三季度,东阿阿胶实现营业收入9…

  • LP敞开聊了几点

    LP敞开聊了几点,LP和GP就像夫妻关系,基金的设立只是关系的开始,更多的磨合是在后面基金存续期间里面。

    创投 2023年7月23日
  • 超2.5亿人都困于脱发,但霸王却越来越惨

    超2.5亿人都困于脱发,但霸王却越来越惨,可见,脱发人群是日趋年轻化的,消费者需求是日渐增长的,但消费者如今更热衷于靠寻医问诊或一劳永逸的植发来解决问题,而非将希望寄托于某款洗发水上。加上霸王一步步踩空了时代的发展机遇,翻红这件事恐怕只会越来越远了。

    2023年4月7日
  • 2023数博会丨海天瑞声贺琳:数据赋能数智新未来_行业动态

    5月27日,2023数博会投资人大会暨数字经济投融资联盟数谷行活动在贵阳举行。大会以“引金聚黔、数智赋能”为主题,邀请优秀行业投资人、知名专…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年5月30日
  • 优衣库涨薪,快时尚又香了?

    优衣库涨薪上热搜,快时尚再度吸引市场目光,快时尚生意又香了?01 优衣库涨薪上热搜最近几年,一直在中国市场保持扩张步伐的快时尚品牌优衣库,前几天又上了热搜。《新品略财经》关注到,优衣库日前宣布,受益于良好业绩表现,优衣库中国宣布自2023年10月起实施薪酬调整,将为员工加薪。据悉,本轮调薪对象主要是

    2023年10月16日
  • 银行卡密码输错三次要冻结多久 解冻方法介绍-财经

    对于银行卡密码输错三次被冻结的事,小编可以说是身有体会,如果银行卡密码输错三次后会冻结多久?这问小编就没错了,小编有过三次银行卡因输错密码三次而被冻结的经历,下面,冻结银行卡解冻方…

    创投 2022年1月25日
  • 生成式AI跌宕起伏

    生成式AI跌宕起伏,本周,ChatGPT仍在继续接受质疑,同时也开始出手大量封禁账号。更多公司开始注重研发自己的“ChatGPT”,积极地涌入生成式AI赛道。但另一面,在AI股的狂热下,众多未有起色的公司开始有了压力。与此同时,阿里、谷歌、Meta等巨头正低调地干起了大事。

    2023年4月9日 创投
  • 财政部:社保基金对股权类资产最大投资比例分别可达30%

    12月6日,财政部联合人力资源社会保障部发布《全国社会保障基金境内投资管理办法(征求意见稿)》(下称《管理办法》),向社会公开征求意见。《管理办法》根据基金投资和监管实践,综合考虑风险收益特征,将全国社保基金投资品种按照存款和利率类、信用固收类、股票类、股权类进行划分,并将境内和境外投资全口径纳入监

    创投 2023年12月6日
  • 直击双十一开局:平台低价混战,李佳琦被「撕」上热搜

    双十一,直接“开撕”了。10月24日下午,淘宝双十一前夕,正当李佳琦在直播间内介绍双十一产品机制时,京东采销人员公开喊话李佳琦要求品牌“二选一”的新闻被爆出,登上热搜,起因是京东收到海氏品牌律师函,投诉京东价格低于李佳琦直播价,违反了“底价协议”,并要求巨额违约金。网传海氏品牌方和京东采销人员朋友圈

    2023年10月25日 创投
  • 怎么做快餐生意可以做好 尤其是新手一定要知道-财经

    一直以来,快餐就以门槛低利润高而受到很多创业者们的欢迎,这篇文章就跟大家聊聊这个话题,怎么做快餐生意才可以做好! 快餐店要多点娱乐元素,比如在墙上挂一台大一点的液晶电视,让顾客在吃…

    创投 2022年1月25日
  • 抖音越追越近,美团的反击战打到哪一步了?

    尽管在本地生活业务上尚未“大力出奇迹”,但抖音的攻势丝毫没有减弱的迹象。最新一个动作是,在距离十一长假期还有两周左右的时间,抖音针对本地生活服务上线官方直播间,为即将到来的超长假期预热。另一边,本地生活“一哥”美团,也在积极为增长略显乏力的直播业务寻找新的流量。雪豹财经社获悉,近两个月,一些抖音的本

    2023年9月20日
  • 「车圈清醒」王传福:自动驾驶这些年都是忽悠

    「车圈清醒」王传福:自动驾驶这些年都是忽悠,比亚迪也许就是想告诉我们:自动驾驶的未来,是更稳定地立足现实。

    2023年4月3日
  • 库迪「供应链」成累赘?

    泼天的热闹今年终于轮到了饮品圈。瑞幸与茅台“联姻”的酱香拿铁刷爆朋友圈、奈雪的茶靠与《范特西》的联名再度唤醒无数人的青春,而库迪在米乳拿铁之后也激起了饮品圈对米咖的兴趣,Coco都可、M Stand等品牌纷纷在近期上新了米乳饮品。众所周知,瑞幸的生椰拿铁走红后,曾带动生椰饮品席卷整个饮品圈。如今库迪

    创投 2023年9月21日
  • 从全球第一酒企到全球第一酒店巨头,洲际如何穿越246年

    洲际酒店是最早进入中国市场的国际酒店集团,其从2003年荣登世界酒店集团300强首位以来,曾连续多年排名世界酒店集团*位。但很少人知晓的是,这家企业的前身竟然是曾经的英国啤酒*,甚至做过世界*的酒企。从“酒”到“酒店”,全球*酒企到全球*酒店巨头,洲际酒店集团和它背后的巴斯家族经历了怎样的246年?

    2024年1月19日
  • 月付用户的福利来啦!抖音月付618好物节专属额度_行业动态

    作为今年经济复苏以后的首个全网大促,618被全网商家达人寄予厚望,平台推出各种预售与满减玩法,让消费者买的实惠,也助力商家把握618生意窗口…” />
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8

    创投 2023年6月9日