《揭开大模型幻觉之谜:数据缺失才是罪魁祸首》
5月17日消息,《科创板日报》报道显示,在今日的OceanBase开发者大会上,蚂蚁集团CTO倪明昱提到,数据是AI发展的基石,数据的边界直接限制了大模型的能力上限,未来所有拥有数据资源的公司都有可能转型为AI驱动的企业。 我认为,这一观点深刻揭示了当前科技领域的一个重要趋势。随着人工智能技术的不断进步,数据的重要性愈发凸显。无论是互联网巨头还是传统行业企业,谁能掌握更多高质量的数据,谁就能在未来的市场竞争中占据优势。因此,如何合法合规地获取、管理和利用数据,已经成为每个企业必须面对的战略课题。同时,这也提醒我们,单纯依赖数据并不足以推动真正的创新,还需要结合算法优化和技术突破,才能让数据发挥出最大的价值。
他认为,当前大模型面临的一大难题是幻觉现象频发,这与数据的不足密切相关。廉价的互联网数据资源正逐渐枯竭,而获取新数据的成本却在不断攀升。与此同时,行业内那些严谨且高价值的数据不仅稀缺,还面临着流动困难的问题。更棘手的是,多模态数据的处理复杂度较高,数据质量的评估也充满挑战。可以预见,在未来的发展中,企业的成败将在很大程度上取决于其数据生产能力和数据应用水平。 在我看来,这一现状揭示了人工智能技术进步背后的隐忧。一方面,我们需要更加注重数据生态系统的建设,通过技术创新来降低高质量数据的获取门槛;另一方面,也应加强跨领域的合作与数据共享机制,让行业数据能够更高效地流通起来。同时,对于多模态数据的处理以及数据质量的把控,应当成为技术研发的重点方向。只有这样,才能真正推动大模型技术走向成熟,为社会创造更大的价值。
何征宇称,蚂蚁集团计划在金融、医疗、生活等领域推动OceanBase在蚂蚁AI核心场景的应用突破,同时持续助力OceanBase的开源开放战略,共同迈向AGI的美好愿景。
据公开资料显示,何征宇在2012年于佐治亚理工学院取得计算机科学博士学位。2012年至2018年间,他在谷歌工作,并发起并主导了开源项目gVisor的创建与开发。
何征宇在2018年加入蚂蚁集团,专注于推动公司的技术基础设施升级。在他的带领下,蚂蚁集团实现了全站云原生化的转型,并在绿色计算和机密计算领域取得了突破性进展。此外,他还主导了开源战略的重要布局,为行业贡献了诸多技术成果。目前,何征宇担任蚂蚁集团副总裁兼首席技术官,其在技术创新方面的卓越表现不仅提升了企业的核心竞争力,也为整个行业的技术发展树立了标杆。 我认为,何征宇的工作充分体现了技术驱动型企业在数字化转型中的重要作用。通过不断探索前沿技术的应用场景,企业能够更好地应对复杂多变的市场环境。同时,开放共享的精神也为企业赢得了良好的行业口碑和社会影响力。未来,希望更多像何征宇这样的技术领袖能够引领行业发展,共同推动科技进步与社会价值的融合。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.014239秒