2023 IKCEST国际大数据竞赛启动:解锁AI使用新姿势

2023-07-14 13:18:22 来源:中央广电总台国际在线 作者:郑思雯

  7月14日­­­,2023 IKCEST第五届“一带一路”国际大数据竞赛暨第九届百度&西安交大大数据竞赛(以下简称“国际大数据竞赛”)启动报名。竞赛聚焦当前社交网络虚假信息泛滥的现状,以“社交网络中多模态虚假媒体内容核查”为题,鼓励全球选手建立多模态模型,为社交网络实现“AI辟谣”。

  连续9年办赛,人才从实践中来到行业中去

  一项人工智能竞赛为何会“硬刚”网络谣言?事实上,国际大数据竞赛一直与现实问题息息相关。

  国际大数据竞赛由教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)、百度公司与西安交通大学联合举办。大赛在2015年创办时,就定下“赛题基于产业真实需求”“为社会培养人工智能、大数据人才”的基调,鼓励全球开发者,用人工智能、大数据手段解决产业实践中的问题。例如,2020年大赛聚焦“高致病性传染病的传播趋势预测”,2021年大赛围绕智能驾驶,2022年聚焦“一带一路”从倡议沿线国家重点语言之间的智能互译。

  国际大数据竞赛旨在培养人工智能、大数据人才

  作为百度“500万AI人才培养计划”的重要部分,国际大数据竞赛举办9年,覆盖五大洲21个国家,近600所高校,累计16000多支队伍参赛,为行业培养大批人才。

  在本届竞赛启动仪式上,中国工程院国际合作局局长、IKCEST常务副主任田琦指出,当下生成式人工智能和大模型的智能化技术,让信息生成、传递和处理都有了新的范式和机遇,对人才的实践和知识迭代能力也提出更高的要求。“希望选手们探索创新解决方案,推动多模态、信息处理技术的迭代升级,促进大数据与人工智能技术更好地服务于‘一带一路’倡议。”

  中国工程院国际合作局局长、IKCEST常务副主任田琦致辞

  眼见未必为实,全球开发者“硬刚”多模态网络谣言

  谣言猛于虎。据统计,新浪微博在2022年处理的虚假信息超过8万条。今年以来,已有“中国电科员工不满强制加班‘怒怼’领导”等虚假信息在网络上引起热议。谣言层出不穷,单靠人力排查效率不高。

  目前,AI已在虚假信息的识别上得到应用,主要涉及自然语言处理技术,对纯文本型的谣言有一定效果。然而社交网络的谣言已呈现多模态趋势:除了文字,还有配图,甚至配上视频,导致眼见也未必为实。

  今年国际大数据竞赛赛题“社交网络中多模态虚假媒体内容核查”,正是针对这一现状,鼓励选手采用多模态的技术手段,融合自然语言处理技术、计算机视觉技术建立模型,以应对图文形式的谣言。

  针对本次大赛,西安交通大学副校长洪军教授认为,“网络谣言不仅要‘人人喊打’,还要打‘七寸’。这次比赛是一次技术的创新实践,相信通过选手们齐心协力,‘造谣一张嘴,辟谣用AI’的那天不会远。”

  西安交通大学副校长洪军教授致辞

  百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜则表示,“在过去半年里,大语言模型所展现出来的智能涌现能力,让机器具备跨越了文本和图像等多种模态的复杂场景的理解与生成能力,今年大赛聚焦社交媒体网络中的多模态信息,更具现实意义。”值得一提的是,为了培养新一代的大模型人才,竞赛鼓励选手借助百度文心大模型的能力,提升建模效率。

  百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜致辞

  数据、平台、奖励安排到位,静待选手报名上分

  根据赛题任务,选手将基于官方指定数据集,通过建模同一事实跨模态数据之间的关系,实现对任一模态信息能够进行虚假和真实性的检测。

  国际大数据竞赛将提供从公开平台上获取的数据集,涉及文娱、经济、健康、时事、国际等多个领域,同时公开中英文验证集供选手优化模型。大赛采用分类任务主流的评价指标F1对预测结果进行自动评价。今年,百度将继续提供开放数据集、高性能算力,以及基于百度飞桨开源深度学习平台的基准模型,选手们可在飞桨AI Studio获得相应的数据资源和算力资源,并进行成果的自动评测。

  2023年IKCEST“一带一路”国际大数据竞赛于7月10日起接受报名,初赛报名截止时间为9月15日,决赛奖金池共20万元人民币。竞赛详情请搜索“IKCEST国际大数据竞赛”了解。(图/文:百度)