作者:吴健和蒂凡尼·惠特菲尔德

吴健博士.D., 最靠谱的网赌软件计算机科学助理教授走在创新和大数据的前沿. 最近,他利用自己的知识,在世界领先的人工智能国际学术会议上展示了他的工作. 2月22日, 2024, 吴提交了一篇题为, “ETDPC:电子论文页面分类的多模态框架”,第36页th 人工智能创新应用年会(IAAI-24), 与 38th AAAI人工智能年会(AAAI) 在加拿大温哥华.

今年,来自各大洲和国家的5000多人参加了会议. 与AAAI相比, 哪个更注重理论贡献, IAAI专注于人工智能在现实场景中的应用. 今年, IAAI的录取率为24%, 使其成为人工智能应用领域竞争最激烈的会议之一.

论文的第一作者Dr. 吴和蒙塔比尔·乔杜里(Muntabir Choudhury),一位高级博士.D. ODU计算机科学专业的学生. 本文提出了一种将电子论文PDF页面划分为13类的新方法, 比如章节, 参考文献, 附录, 还有标题页. 新方法, 称为多模态模型, 利用深度神经网络将文本和视觉信息融合到单个表示中. 与最先进的方法相比,这种方法取得了更高的性能, 哪些只基于文本或视觉信息. 新方法的准确度提高了至少25%. 本工作为建立一个用户友好的ETDs在线阅读器奠定了基础. 而不是在电脑上下载和阅读冗长的ETD, 用户可以直接导航到他们感兴趣的部分. Dr. 吴说:“蒙塔比尔是一名优秀的学生,我很高兴他两年的努力终于得到了回报.”

该方法部分由博物馆和图书馆服务研究所提供的研究经费资助. 除了蒙塔比尔和吴, 其他参与者包括拉米亚·萨尔萨比尔, ODU的研究生, 爱德华·福克斯, Ph.D.弗吉尼亚理工大学计算机科学教授比尔·英格拉姆(Bill Ingram)博士.D., 弗吉尼亚理工大学图书馆信息技术助理教授、副院长兼执行主任.

ODU的几位现任和前任教授出席了会议. 李江(ECE, ODU),博士. 吴鸿毅(美国亚利桑那大学),吴洪毅博士. 吴鹤(国家自然科学基金).