文档理解
从感知到洞察
多模态理解、生成与智能分析
- ▸ACL/EMNLP/ICDAR顶级论文
- ▸翻译/航运/物流/医学/制造落地
- ▸让文档从「可见」到「可理解」

我们的研究围绕三个核心领域展开:
从感知到洞察
多模态理解、生成与智能分析
从界面到共生
自然高效交互与人机协同设计
从辅助到增强
人类认知与AI融合复杂系统
三个方向相互支撑、协同发展:文档理解提供核心信息处理能力,交互技术使人机沟通更顺畅,协同认知从根本上优化人机共生系统的整体智能。
实验室近年发表的代表性学术论文
如需了解实验室、合作研究或招生信息,请与我们联系。
在过去的这一年里,我个人的 GitHub 提交记录是 870 次。
在 H!NT Lab,我们不迷信空泛的头衔,也对纸上谈兵毫无兴趣。科研与工程的厚重感,从来不是靠嘴说出来的,而是靠一行行代码、一次次 debug 和日复一日的推进砸出来的。
我不以履历和门第筛人,只以真实的行动识人。你可以基础薄弱,可以非科班出身,也可以毫无经验,但你必须愿意双手沾满泥土(Get your hands dirty)。哪怕起步的代码再粗糙、落地的方案再笨拙,只要我看到你在实打实地行动与反馈,我就愿意倾囊相授。
因此,在敲开这扇门之前,请先完成一件具体的小事。沉下心,读完本页的任意一个项目,然后在邮件里简明扼要地告诉我三点:
▸你对哪个痛点感兴趣?
▸你如何理解它的底层逻辑?
▸如果交给你,你准备先敲下哪一段代码,或是做哪一步尝试?
期待与你们的同行,为社会做一点有意义的事。