搜索
您的当前位置:首页正文

表格数据提取方法、装置、计算机设备和存储介质[发明专利]

来源:知库网
专利内容由知识产权出版社提供

专利名称:表格数据提取方法、装置、计算机设备和存储介质专利类型:发明专利发明人:朱龙军

申请号:CN202011269426.9申请日:20201113公开号:CN112257400A公开日:20210122

摘要:本申请涉及一种基于人工智能中自然语言处理技术的表格数据提取方法、装置、计算机设备和存储介质。所述方法包括:获取第一方向边框缺失表格;获取所述第一方向边框缺失表格中的关键字;通过预设语言模型,识别不同表格单元中所述关键字的主从关系,所述预设语言模型用于识别关键字属于同一语句的概率;根据所述主从关系补充所述第一方向边框缺失表格中的第一方向边框;识别并提取所述补充后的表格内的表格数据。本申请中,通过预设语言模型,来识别第一方向边框缺失表格中关键字的主从关系,而后基于确定的主从关系来补充第一方向边框,进而进行表格数据的提取,具备更高的数据提取准确率。

申请人:腾讯科技(深圳)有限公司

地址:518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层

国籍:CN

代理机构:广州华进联合专利商标代理有限公司

代理人:黄晶晶

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top