算法赛道

赛题名称:人工智能多媒体识别与理解技术在金融领域应用研究


图形、文字、语音等多媒体信息的识别与理解,是人工智能研究的热点领域,在金融领域有着广泛的应用潜力和前景,其中图片中的文字识别(OCR)在商业领域有重要的应用价值,在金融领域应用已经取得一定成效。通过OCR技术代替人工处理大量、复杂、繁琐的手工录入信息工作,能够加快金融产品和服务的上市速度,降低人员成本,提升客户体验,目前正成为银行数字化转型的重要途径。


本次比赛将提供面向金融场景的票据数据集,参赛队利用OCR技术自动识别票据影像资料后,再通过AI智能判断所识别文字的内在逻辑,自动录入到相应的栏位中。OCR主要包括两个主要任务:一是检测出所有可能涵盖印刷体或手写体文字的文本框;二是识别印刷体或手写体文本框中的文字内容。难点包括:印刷体的打印错位、相互重叠;手写体的随意性、模糊、字迹潦草;票据本身的褶皱、弯曲、纹理等;扫描件的图像质量差别,文字模糊、光照影响,透视畸变等。


组委会通过赛事平台公布赛题,参赛队需要进入到主办方提供的赛事平台,进行模型训练、深入学习,通过在线编程提供解决方案。提交内容包括设计说明、模型和代码、输出结果文件等。



报名要求:


(1)大赛面向高校在校学生(包含本科生、硕士生、博士生),已毕业的学生不具备参赛资格;


(2)黑客马拉松赛道每支参赛队人数最多不超过3人,创意路演赛道每支参赛队人数最多不超过2人,允许跨年级、跨专业组队;


(3)参赛者可以代表学校同时参加两个赛道的比赛;


(4)每支参赛队伍需配备一名指导老师,指导老师必须是参赛队所属高校的正式教师,参赛指导老师不得参与本届大赛相关赛事评审工作;


(5)大赛期间报名以及所有材料均须进行在线提交;大赛使用语言为中文和英文,所有提交材料及演讲均须使用中文或者英文。