金融界2024年2月20日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“文本处理方法、装置、设备、存储介质及程序产品“,公开号CN117573940A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种文本处理方法、装置、设备、存储介质及程序产品,涉及自然语言处理领域。该方法包括:获取文本数据;采用预设窗口尺寸对文本数据进行字符划分,得到多个文本字符串,预设窗口尺寸用于表征字符划分粒度;对多个文本字符串分别进行自然语言类型识别,得到与多个文本字符串分别对应的类型识别结果;响应于第一文本字符串对应的第一类型识别结果和其他文本字符串对应的第二类型识别结果不同,生成混合类型信息。通过以上方式,能够避免仅能对文本数据整体进行单一自然语言类型识别的局限性,从多个文本字符串的角度对文本数据进行更精准的分析,提高对文本数据的信息掌握程度。本申请可应用于云技术、人工智能、智慧交通等各种场景。