基于LDA的膳食补充剂专利分析

刘哲1*,蔡梦媛1,屈贤明2

1(河南工业大学 管理学院,河南 郑州,450001)2(中国工程院战略咨询中心,北京,100088)

摘 要 膳食补充剂可以有针对性地提供人体所需营养。为深入挖掘和分析膳食补充剂领域的专利信息,观察技术动态、市场趋势及潜在创新方向,该文采用了潜在狄利克雷分布模型(latent Dirichlet allocation,LDA)对专利文献进行了主题建模分析。研究从HimmPat专利数据库中检索了截止于2024年的7 873份专利文件,并利用LDA模型对其摘要进行主题建模,结果表明膳食补充剂的核心技术聚焦于膳食补充剂的“药物疗效”“原料”“营养素”与“微生物”4个主题。随着科学研究的进步和消费者需求的不断变化,膳食补充剂的功能已经向更加个性化和多功能化的方向发展,利用先进技术从天然食材中提取生物活性化合物成为重要趋势。

关键词 LDA;膳食补充剂;专利分析;主题聚类;趋势分析

膳食不合理导致的人体营养与健康效应问题越来越突出,膳食结构调整对人体健康具有重要意义[1]。膳食补充剂作为维护和促进人体健康的重要手段,其市场需求与日俱增,推动膳食补充剂行业发展有助于优化整个食品产业结构,促进消费升级。而膳食补充剂行业在食品工业中正面临着技术创新的迫切需求,当前国内外学者对膳食补充剂的研究主要集中在其功效、安全性和市场监管等方面,例如新型膳食补充剂可以辅助高尿酸血症患者降低尿酸水平[2],小剂量补充维生素D能够更有效地降低癌症的总发病率和死亡率[3],孕期补充维生素D有助于预防儿童期高血压及相关心血管疾病风险[4-5],维生素K通过其非经典代谢途径保护细胞免受氧化损伤[6]。为了更好地理解膳食补充剂领域的技术演进和市场动态,本文采用潜在狄利克雷分布模型(latent Dirichlet allocation,LDA)对搜集到的专利文献的摘要进行主题建模。LDA模型作为一种文本挖掘技术,能够有效地从大量文本数据中提取主题信息,这对于理解膳食补充剂领域的技术演进和市场动态具有重要意义[6]。通过分析全球膳食补充剂专利的分布情况、专利申请与授权趋势、主要申请人情况以及专利技术布局,为我国膳食补充剂行业的创新发展提供科学依据,并为消费者选择高质量膳食补充剂提供参考。本文研究框架如图1所示。

图1 研究框架

Fig.1 Research framework

1 数据与方法

1.1 数据采集与预处理

在20世纪末膳食补充剂领域的监管体系得以构建并逐步完善[7],本研究中膳食补充剂专利数据来自HimmPat数据库。HimmPat数据库以其广泛的专利覆盖范围和深度分析能力著称,目前HimmPat数据库已收集全球超过1.9亿份专利数据,包括26家主要专利局的全文数据和170家专利局的摘要数据,该数据库不仅提供专利文本和图像,还包含法律状态、引用关系、同族专利等关键信息,使用户能够全面掌握技术动态和竞争格局。多于230个搜索和分析维度,支持深度挖掘与分析,通过先进的人工智能技术实现专利语义检索和智能分析,显著提升检索效率和准确性。此外,作为纯国产数据库,它提供了更高的数据安全性和服务稳定性,同时设计注重用户体验,操作简单,并能根据企业用户的特定需求提供定制化服务。

本文采用中英文结合的低噪音关键词确定检索式:(((“膳食补充剂”OR“营养补充剂”OR“功能性补充剂”OR“Dietary Supplements”OR“Nutritional Supplements”OR“Health Supplements”OR“Natural Health Products”)/ta AND (A22 OR A23 OR C07K OR C08B OR C08F OR C12P OR C12R OR C12Y)/cpc)) AND (C1491 or C1492)/nec AND (发明申请OR发明授权)。本研究将专利数据的检索时间设置为截至2024年,共获取11 282份专利文献。为便于对主题模型进行分析,需要对收集到的专利元数据进行预处理。专利摘要是对整个专利核心内容的凝练[8],首先剔除了没有摘要的数据,最终获得了7 873份专利文件。此外,摘要中的词汇是运行主题模型的关键,但其中包含许多干扰词汇,如停用词、日期等与主题无关的词汇,因此进一步对摘要进行文本清洗。删除摘要的标点符号、特殊字符、数字和其他非字母字符,得到了不含字符的纯文本,然后对文本进行分词。在此过程中,构建和不断完善停用词词典、自定义词典和同义词词典,以优化词段结果,确保相关词汇和主题的准确性[9]

1.2 LDA主题模型

LDA主题模型是一种无监督的机器学习方法,其通过构建模型来识别文档中的主题信息,挖掘出隐藏的主题信息,利用词语、主题、文本之间的关系解决文本聚类中语义挖掘的问题[10],是由BLEI等[11]在2003年首次提出的一种主题建模的贝叶斯概率方法,主要通过概率分布来表示每个文档中包含的主题以及每个主题中词语的分布情况。图2展示了LDA的文本生成过程,首先,LDA模型从先验分布(狄利克雷分布)Dirt(β)中随机生成K个主题的关键词分布Φκ,然后从另一个先验分布(狄利克雷分布)Dirt(α)中随机生成M篇文档的文档-主题分布θm,从而确定每篇文档的主题序列。最后,基于文档中的词数Nm(通常假设服从泊松分布)和关键词分布Φκ,生成每篇文档的具体词汇序列[12]

图2 LDA模型图解

Fig.2 Diagram of the LDA Model

参数估计是LDA模型最重要的任务,在参数设置方面需要审慎选取超参数(如主题数量、狄利克雷先验参数、迭代次数等),以确保模型能够捕获文本数据中的主题结构,同时避免对数据的过度拟合[13]。本文使用Python中的scikit-learn库来训练LDA主题模型,同时设置特征提取器的参数,min_df=10表示至少出现在10个文档中的词将被保留,设置n_top_words=50,n_topics=4,代表设置输出的主题数为4,而这4个主题的输出关键词个数都为50。设置α=‘auto’、β=‘auto’、K=4。其中,α和β是LDA主题模型的重要超参数,分别控制文档的主题分布和主题的词分布,设置为‘auto’。该模型能从语料库中学习非对称前验,并自动找到合适的参数。

在进行LDA模型输出主题时,需要设置最优主题数。选择最优主题数可以帮助提高LDA模型的解释性,使得生成得主题更具代表性,容易被理解和解释。本文基于LDA主题模型的困惑度(perplexity)和一致性(coherence)指标分析结果,确定最优主题数为4个。如图3所示,从困惑度曲线来看,当主题数量从2增加到4时,困惑度值从420显著下降到360左右,表明模型拟合效果得到明显改善。然而当主题数超过4后,困惑度下降幅度明显趋缓,在主题数4到16的区间内仅下降不到20个点,此时,继续增加主题数量所获得的收益小于增加主题数量的投入[14],这种边际效益递减的现象表明继续增加主题数对提升模型性能的作用有限,反而可能导致模型过度拟合训练数据。仅依据困惑度选取的主题数目往往过大,而过多的主题可能导致模型过拟合,致使抽取的主题之间有较高的相似度[15-16],因此本文结合使用一致性指标。

图3 主题数量的困惑度

Fig.3 Perplexity of the number of topics

如图4一致性得分曲线所示,主题数为4时得分达到峰值,明显高于其他主题数量下的得分值,这一结果表明4个主题的划分能够最好地保持主题内部的词语高度相关,同时确保不同主题之间具有足够的区分度,能够最好地反映文本数据的主题结构。综合困惑度与一致性得分结果,本文选择最优主题数为4。

图4 主题数量的一致性

Fig.4 Consistency of the number of topics

结合可视化工具PyLDAvis对主题数为4时的聚类结果进行展示。左侧部分Intertopic Distance Map中具有标号的圆圈代表LDA主题模型提取出的4个主题,其大小代表每个主题的权重值,圆圈越大,主题越重要,各圆圈间的距离与方位代表主题间的关联度,相隔越近,主题间的关联度越大[17],整体可视化通过多维缩放技术将高维主题关系降维呈现,其中主题空间分布和关键词列表的联动设计,可帮助快速识别膳食补充剂的核心主题及特征词汇。可视化结果如图5所示。

图5 主题数为4时PylDavis的可视化结果

Fig.5 Visualization results of PylDavis under 4 topics

2 结果与分析

2.1 主题聚类

根据上述分析结果,通过使用Python代码建立了主题模型,揭示膳食补充剂所涉及的主要技术以及包含的主要成分等,并根据定义的关键词对主题进行分类,分析文档中主题分布以及词汇分布,将每个主题的关键词展示于词云图中(图6)。词云图中不同大小和颜色的字体展示文本中出现频率较高的词汇,字体越大,表示该词在文本中出现的频率越高。根据词语图的可视化结果更加直观地了解到膳食补充剂专利所涉及的主题。

a-主题1药物疗效;b-主题3原料;c-主题2营养素;d-主题4微生物

图6 膳食补充剂专利词云图

Fig.6 Word clouds of dietary supplement patents

主题1反映出膳食补充剂的药物疗效。从“预防”“改善”“治疗”以及“药物”等词,可以直观得出膳食补充剂改善人体健康状况、预防疾病等功能。其他词汇如“细胞”“疾病”和“健康”进一步强调了膳食补充剂在增强健康、预防疾病和支持各种身体功能方面的全面作用。该领域专利主要集中于利用先进技术进行原料提取、化合物合成,达成对人体产生药物疗效的目的,如将Nrf2活化剂应用于膳食补充剂,可显著抑制胶原蛋白的积累和氧化应激,防治糖尿病肾病;利用超临界萃取法从原料提取各种营养成分,制备成膳食补充剂配合律动疗法可有效提升防止骨质疏松的效果。膳食补充剂也可作为药物治疗的补充,进一步降低血脂水平,甚至可能减少药物剂量[18]

主题2直观表明膳食补充剂为人体补充的各类营养素成分,例如“维生素”“矿物质”“脂肪酸”与“蛋白质”等等。当人体无法通过日常生活的饮食满足对某些营养物质的需要时,可选择性地通过膳食补充剂补充所需的营养成分,或是为特定功效而选择含某些营养素的膳食补充剂。例如,含有能量源和微量营养素组合的膳食补充剂,其设计用于促进身高比正常标准矮的青春期前儿童的生长;包含多种矿物质的矿物化合物以及包含二十碳五烯酸(eicosapentaenoic acid,EPA)和二十二碳六烯酸(docosahexaenoic acid,DHA)的干粉形式的鱼油颗粒,通过其中的ω-3脂肪酸EPA和DHA来补充饮食;含有ω-3、维生素和矿物质组合物,其递送方法的研究,用于提高人体视力和智力发育。此外,特殊人群为避免因膳食结构不合理对身体造成损害,适量选用膳食补充剂维护身体健康、改善警觉性等[19]

主题3主要与膳食补充剂制作时所需要的“原料”有关。“草药”“植物”“人参”“水果”等强调了膳食补充剂的自然来源,此外,“天然残基”“发酵”、“多糖”及“提取”等词汇,展示了加工技术,“活性”“抗氧化”等凸显了原料的健康作用,而“温度”则提示了原料在不同条件下的稳定性和效用。例如,对草本植物等天然原料利用先进的提取加工技术,通过天然原料的发酵产物制备细胞外囊泡及其生产和富集制备膳食补充剂,能改善肠易激综合征膳食补充剂天然凝胶原料的制备方法研究等[20]

主题4展示了膳食补充剂可以为人体提供“益生菌”“微生物”“杆菌”以及“菌株”等多种微生物肠道菌群作为一个微生态系统,其平衡与否与机体的健康状况密切相关[21],而肠道菌群由各种微生物组成,肠道微生物的组成变化或肠道微生物对食物成分的代谢变化会影响人体对食物中膳食营养素的吸收[22]。膳食补充剂微生物领域的技术创新聚焦于利用先进的生物技术和基因编辑工具来探索和优化微生物及其代谢产物的应用,如开发复合微生态制剂,将多种益生菌与益生元、植物提取物等结合,以增强肠道健康;采用合成生物学技术大规模生产麦角硫因,为开发高效益生菌及其次生代谢产物提供新路径;利用基因编辑工具如CRISPR/Cas9对微生物进行基因层面的改良,使其能够高效地合成对人体有益的活性成分等。

上述4个主题的分析得出膳食补充剂专利所涉及的四大领域,分别是“药物疗效”“营养素”“原料”与“微生物”,如表1所示。

表1 主题聚类分析结果

Table 1 Results of thematic clustering

技术编号及名称该主题下关键词#1.药物疗效治疗、预防、改善、增加、功能#2.营养素维生素、矿物质、脂肪酸、氨基酸、胡萝卜素#3.原料活性、植物、发酵、提取、干燥#4.微生物益生菌、水解、杆菌、改善、菌株

2.2 膳食补充剂专利基础数据分析

2.2.1 膳食补充剂专利数据分析

图7为全球膳食补充剂领域专利数量排名前十的国家分布情况,揭示了膳食补充剂技术活跃区域分布,有效辅助了全球膳食补充剂产业布局分析和竞争态势研判。其中美国拥有全球最大的膳食补充剂市场,消费者较为关注营养与健康,膳食补充剂行业是美国经济不可分割的一部分[23]。近年来,韩国消费者购买健康营养品的市场不断扩大,同时技术水平不断提高,例如韩国食品研究院研发出的天然肉类蛋白质“氨基20”生产技术取得成功[24]。中国作为全球第二大经济体,为膳食补充剂专利的研发提供了广阔的发展空间,同时全球跨境电子商务的发展推动着膳食补充剂行业的国际同步和快速发展[25]。瑞士凭借其优渥的自然环境资源与生产的高标准要求,使得瑞士膳食补充剂被视为品质的象征。德国有关膳食补充剂的法规较为严格,规范了膳食补充剂的流通,旨在促进膳食补充剂市场健康发展,保护消费者的健康[26]。意大利、荷兰、加拿大、法国和日本等国家在膳食补充剂某些细分领域仍具有重要地位,例如,加拿大广泛使用天然健康产品,如维生素、矿物质鱼油等补充营养的不足[27]。日本政府高度重视发展健康食品市场,具有药物疗效的食品与草药补充剂等领域研究深厚[28]

图7 膳食补充剂专利全球分布

Fig.7 Global distribution of dietary supplement patents

2.2.2 专利申请与授权趋势分析

申请与授权趋势图可通过时间序列数据直观展现了行业的技术发展动态,其中专利申请量曲线反映创新活跃度,而授权量曲线则体现技术成果的转化效率。本研究专利申请量主要反映出膳食补充剂行业的创新程度与发展潜力。授权量代表审查通过的授权数量,能够体现出膳食补充剂领域技术创新的水平,高授权量表明良好的创新能力与政策环境,侧面反映出国家或地区的经济发展水平和科研力度。本文对2000年后的膳食补充剂专利申请与授权趋势进行分析,如图8所示。

图8 膳食补充剂专利申请与授权趋势分析

Fig.8 Trend analysis in dietary supplement patent applications and grants

2.2.3 主要专利申请企业分析

图9提供了全球膳食补充剂领域前五位专利申请人的专利量,呈现了其竞争格局,这种可视化对比能快速识别产业核心竞争者,辅助判断行业技术主导权的分布态势。意大利阿尔法西格玛公司专注于营养产品与膳食补充剂的研发,提供涵盖多种营养物质的膳食补充剂,能够满足不同的健康需求,强调产品的科学性与天然性。荷兰帝斯曼提供各种膳食补充剂原材料,拥有众多的研发中心,旨在满足消费者健康需求。瑞士雀巢在膳食补充剂领域成立核心部门“雀巢健康科学”,为特定的健康需求提供科学的解决方案,推动着膳食补充剂领域的创新。美国惠氏排名第4,主要提供以含维生素与矿物质为主的膳食补充剂。美国雅培在婴儿营养、成人营养和特殊用途食品领域都存在较强的创新能力和市场影响力。

图9 前五位膳食补充剂专利申请企业

Fig.9 Top five patent applicants for dietary supplements

对膳食补充剂的4个专利主题“药物疗效”、“营养素”、“原料”和“微生物”排名前五的组织进行统计,如表2所示。意大利阿尔法西格玛在“药物疗效”领域处于优势地位,日本钟化注重于膳食补充剂的功能性,因而在“药物疗效”领域表现出众。美国惠氏与瑞士雀巢专注于研究膳食补充剂所提供的“营养素”,对于婴儿健康都有涉猎。意大利阿尔法西格玛和瑞士雀巢除了研究“药物疗效”与“营养素”外,格外重视膳食补充剂“原料”的选取利用,意大利阿尔法西格玛生产标准极为严格,瑞士具有良好的自然条件,雀巢公司的“植物基”是研发重点。“微生物”领域排名靠前的是荷兰帝斯曼与德国巴斯夫,荷兰帝斯曼致力于开发基于微生物发酵技术的可持续维生素,德国巴斯夫利用微生物技术开发功能性膳食补充剂与益生菌产品。美国的各个公司在4个专利主题领域占比较重,表明美国在膳食补充剂行业的领先地位以及市场领导,荷兰帝斯曼在3个主题中都名列前茅,展示了其在膳食补充剂领域的广泛影响力与技术实力。

表2 膳食补充剂专利主题分类中的前五位组织

Table 2 Top five organizations in dietary supplement patent topics

专利分类第1位第2位第3位第4位第5位药物疗效意大利阿尔法西格玛日本钟化美国美乐家美国阿彻丹尼尔斯米德兰荷兰帝斯曼营养素美国惠氏瑞士雀巢美国曼纳特荷兰帝斯曼美国Drugtech原料瑞士雀巢意大利阿尔法西格玛瑞士阿玛森蒂斯美国自由健康荷兰帝斯曼微生物荷兰帝斯曼德国巴斯夫美国雅培瑞典Laminaria美国MJN

注:美国Drugtech、瑞典 Laminaria为专利公司。

2.2.4 膳食补充剂专利技术布局分析

通过分析专利的技术分布,可以掌握行业的技术领域分布特征[29]。目前,国际专利分类(International Patent Classification,IPC)是国际上通用的专利文献分类,也是技术研发的活跃区域的集中体现[30]。为统一IPC分类标准,本文主要对于2016年1月1日起至2025年1月6日的1 494项专利技术进行分析,表3所示为IPC数量排名前十的小类分布。

表3 膳食补充剂专利中的主要IPC小类分布

Table 3 Distribution of key IPC subclasses in dietary supplement patents

IPC小类含义专利件数A23L未列入其他类目的食品、食料或非酒精饮料及其处理或制备1494A61K准备用于医疗、牙科或盥洗用品目的1171C12N微生物或酶 其组合物 繁殖、保存或维持微生物 突变或基因工程 培养基121A23K特别适合动物的饲料 特别适用于其生产的方法39C07C无环或碳环化合物32A23J食用蛋白质组合物 食用蛋白质的加工 食用磷脂组合物28A23P未被其他单一小类所完全包含的食料成型或加工25A61P化合物或药物制剂的特定治疗活性24A23G可可 可可制品 例如巧克力 可可或可可制品的代用品 糖食19C07D杂环化合物16

其中A23L与A61K数量较高,表明膳食补充剂的药物疗效以及原料的重要性。C12N主要为膳食补充剂涉及微生物菌株开发应用的专利;其他小类如A23K、A23P应用于生产加工,C07C、A23J、A61P、A23G与C07D涉及膳食补充剂中含有的活性成分及化合物等。IPC小类分布反映了膳食补充剂涵盖的多个领域以及市场细分,膳食补充剂行业关注营养价值的同时,不断发展相关技术水平。

图10与表4展示了膳食补充剂专利在A23L技术细分类别中的分布情况,A23L33/10与A23L33/105的专利数量最多,表明添加剂与植物提取物在膳食补充剂领域的广泛应用,其次A23L33/00拥有204件专利,凸显出膳食补充剂对于营养功效的关注度。A23L33/135、A23L33/16、A23L33/15和A23L33/175几项分类反映出益生菌、矿物质、维生素、氨基酸等营养成分在膳食补充剂中的重要性。整体而言,A23L领域的技术创新围绕功能性成分的提取与加工方法,植物提取物、益生菌和矿物质等领域具有较大的发展潜力。

表4 膳食补充剂专利中的A23L技术细分列表

Table 4 A23L technology distribution in dietary supplement patents

IPC小类含义专利件数A23L33/10改变营养性质的添加剂271A23L33/105植物提取物 其人工复制品或其衍生物264A23L33/00改变食物的营养品质 膳食产品 及其制备品或处理品204A23L33/135细菌或其衍生物 如益生菌68A23L33/16无机盐类 矿物质 微量元素66A23L33/15维生素62A23L33/175氨基酸44A23L19/00水果或蔬菜制品 及其制备品或处理品30A23L33/125含有碳水化合物糖浆 含有糖 含有糖醇 含有淀粉水解产物28A23L2/52添加成分26

图10 膳食补充剂专利中的A23L技术细分图

Fig.10 A23L technology breakdown in dietary supplement patents

如图11与表5所示,膳食补充剂专利在A61K技术细分类别中的分布情况,A61K技术细分各类别数量相较于A23L较少,其主要集中于天然成分、化学成分与特殊剂型的研发。A61K9/00位居第一,表明膳食补充剂的剂型也是当前的研发热点。A61K36/00、A61K35/747、A61K36/185与A61K36/73反映了天然植物作为膳食补充剂原料的应用,A61K31/198、A61K31/19、A61K31/05与A61K31/20凸显了有机酸等化学物质的重要性,A61K35/745有18件专利代表益生菌也存在较高的技术活跃度。

表5 膳食补充剂专利中的A61K技术细分列表

Table 5 A61K technology distribution in dietary supplement patents

IPC小类含义专利件数A61K9/00具有特殊物理形态的药物制剂48A61K36/00含有藻类、地衣、真菌或植物或其衍生物的成分未定的药物制剂 如传统草药35A61K35/747乳杆菌 如嗜酸乳杆菌或短乳杆菌32A61K36/185双子叶植物纲27A61K31/198α-氨基酸 例如丙氨酸或乙二胺四乙酸25A61K31/19羧酸 例如丙戊酸18A61K35/745双歧杆菌18

续表5

IPC小类含义专利件数A61K36/73蔷薇科 例如草莓、花楸果、黑莓、梨子或火棘等18A61K31/05酚类16A61K31/20具有与7个或更多碳原子链结合的羧基 例如硬脂酸、棕榈酸、花生酸15

图11 膳食补充剂专利中的A61K技术细分图

Fig.11 A61K Technology breakdown in dietary supplement patents

图12选取膳食补充剂专利数量排名前五的组织更加直观的观察到不同组织在膳食补充剂所涉及的“药物疗效”“营养素”“原料”和“微生物”四大关键领域的专利成果。其中,“原料”“微生物”与“营养素”专利量较高,表明组织在进行膳食补充剂专利研发时,注重其所能为人体提供的营养价值、微生物以及膳食补充剂的原料,侧面反映出相较于“营养素”“原料”和“微生物”,有关“药物疗效”专利研发仍需继续投入。具体分析,膳食补充剂专利技术布局的4个主要领域及其相关的主要组织,分别为药物疗效(意大利阿尔法西格玛)、原料(荷兰帝斯曼和瑞士雀巢)、营养素(美国惠氏)和微生物(美国雅培)。从总体分布来看,这些组织在各自领域的技术布局反映了膳食补充剂行业的多元化创新方向,这种技术分布不仅体现了行业内的专业化分工,也揭示了全球膳食补充剂市场的竞争格局和技术热点,为行业未来的创新和发展提供了重要参考。

图12 前五位主要组织膳食补充剂专利技术布局

Fig.12 Technical layout by top five organizations in dietary supplement patents

3 结论

3.1 主要发现

通过对膳食补充剂领域专利的LDA主题建模分析,得到4个主题揭示该领域当前的主要研究方向,主要集中于“药物疗效”“营养素”“原料”和“微生物”四大领域。本文揭示了全球范围内这些领域的技术布局与市场动态。通过LDA模型的应用和IPC分类的统计,深入揭示了膳食补充剂领域的主要研究主题、技术分类和市场趋势,发现“原料”“营养素”和“微生物”是膳食补充剂领域中最受关注的三大主题,占专利总数的近60%。同时,从IPC分类来看,A23L(不包含在A21D或A23B~A23J小类中的食品、食料或非酒精饮料)、A61K(医药、卫生用品、个人护理产品的制备或处理)和C12N(微生物或酶;其制备或处理;组合物)是膳食补充剂专利申请的主要分类,这表明该领域的研究和技术创新主要集中在营养素成分、微生物与原料制备。此外,美国、欧洲和亚洲是膳食补充剂专利申请的主要地区,其中美国的专利申请数量占据领先地位,而专利申请量的数量同时与地区的经济发展水平、消费者健康意识以及科技创新实力密切相关。

3.2 局限性

本研究采用的LDA模型虽然在文本挖掘和主题建模领域表现出色,但该方法也存在一些局限性。首先,LDA模型对超参数的选择非常敏感,主题数量的设定可能显著影响模型的效果,不恰当的主题数量可能导致过度拟合或信息丢失。其次,由于LDA不考虑单词出现的顺序及其语法结构,因此可能无法捕捉到文本中的复杂语义关系。同时,LDA模型对文本预处理的质量要求较高,停用词和噪声数据可能会严重影响主题提取的准确性。最后,虽然LDA能够有效地识别出潜在的主题,但这些主题往往需要领域知识才能准确解释,并且其泛化能力可能在不同数据集上有所限制。所以在利用LDA模型进行分析时,需谨慎考虑这些因素以确保结果的有效性和可靠性,对于未来的研究工作,探索更先进的文本分析技术或改进LDA模型的方法可能是提高分析精度的一个方向。

参考文献

[1] 张奕,冯适,王孝忠,等.膳食营养与健康效应评价研究进展[J].食品科学,2022,43(11):311-319.ZHANG Y,FENG S,WANG X Z,et al.Evaluation of dietary nutrition and health effect:A review[J].Food Science,2022,43(11):311-319.

[2] 吴逢霖,张家硕,江雪,等.膳食补充剂辅助治疗高尿酸血症的研究进展[J].中国老年保健医学,2024,22(3):96-101.WU F L,ZHANG J S,JIANG X,et al.Progress in the study of dietary supplements for the adjunctive treatment of hyperuricemia[J].Chinese Journal of Geriatric Care,2024,22(3):96-101.

[3] KEUM N,CHEN Q Y,LEE D H,et al.Vitamin D supplementation and total cancer incidence and mortality by daily vs.infrequent large-bolus dosing strategies:A meta-analysis of randomised controlled trials[J].British Journal of Cancer,2022,127(5):872-878.

[4] PEDERSEN J N,DALGÅRD C,MÖLLER S,et al.Early pregnancy vitamin D status is associated with blood pressure in children:An odense child cohort study[J].The American Journal of Clinical Nutrition,2022,116(2):470-481.

[5] MISHIMA E,ITO J,WU Z J,et al.A non-canonical vitamin K cycle is a potent ferroptosis suppressor[J].Nature,2022,608(7924):778-783.

[6] 王晨,廖启明.基于改进的LDA模型的文献主题挖掘与演化趋势研究:以个人隐私信息保护领域为例[J].情报科学,2023,41(10):112-120.WANG C,LIAO Q M.Literature topic mining and evolutionary trends based on improved LDA model:Taking the field of personal privacy information protection as an example[J].Information Science,2023,41(10):112-120.

[7] 闫志刚,张成岗.美国“保健食品” 监管百年:科学、产业与监管博弈[J].中国高校社会科学,2019(6):104-114;157.YAN Z G,ZHANG C G.Years of regulation of dietary supplements in the United States:Science,industry and gaming of regulation[J].Social Sciences in Chinese Higher Education Institutions,2019(6):104-114;157.

[8] 尹丽春,王胜斌,苏晨.基于专利主题特征分析的概念验证方法研究[J].中国发明与专利,2024,21(11):13-22.YIN L C,WANG S B,SU C.Research on concept verification method based on patent theme feature analysis[J].China Invention &Patent,2024,21(11):13-22.

[9] LO T R,HE B,OUNIS I.Automatically building a stopword list for an information retrieval system[J].Journal of Digital Information Management,2005,3(1):3-8.

[10] KAR M,NUNES S,RIBEIRO C.Summarization of changes in dynamic text collections using Latent Dirichlet Allocation model[J].Information Processing &Management,2015,51(6):809-833.

[11] BLEI D M,NG A Y,JORDAN M I.Latent Dirichlet allocation[J].Journal of Machine Learning Research,2003,3:993-1022.

[12] YU D J,XIANG B.Discovering topics and trends in the field of artificial intelligence:Using LDA topic modeling[J].Expert Systems with Applications,2023,225:120114.

[13] 王鹏,高铖,陈晓美.基于LDA模型的文本聚类研究[J].情报科学,2015,33(1):63-68.WANG P,GAO C,CHEN X M.Research on LDA model based on text clustering[J].Information Science,2015,33(1):63-68.

[14] 吴江,侯绍新,靳萌萌,等.基于LDA模型特征选择的在线医疗社区文本分类及用户聚类研究[J].情报学报,2017,36(11):1183-1191.WU J,HOU S X,JIN M M,et al.LDA feature selection based text classification and user clustering in Chinese online health community[J].Journal of the China Society for Scientific and Technical Information,2017,36(11):1183-1191.

[15] 张涛,马海群.一种基于LDA主题模型的政策文本聚类方法研究[J].数据分析与知识发现,2018,2(9):59-65.ZHANG T,MA H Q.Clustering policy texts based on LDA topic model[J].Data Analysis and Knowledge Discovery,2018,2(9):59-65.

[16] NEWMAN D,ASUNCION U A,SMYTH P,et al.Distributed algorithms for topic models[J].Journal of Machine Learning Research,2009,10:1801-1828.

[17] 杨益兴,吴刚,陈兰芳,等.基于LDA主题模型的多阶段生鲜消费者需求研究:以京东为例[J].管理案例研究与评论,2024,17(1):105-122.YANG Y X,WU G,CHEN L F,et al.Research on multi-stage fresh consumer demands based on LDA topic model:A case of JingDong[J].Journal of Management Case Studies,2024,17(1):105-122.

[18] HUNTER P M,HEGELE R A.Functional foods and dietary supplements for the management of dyslipidaemia[J].Nature Reviews Endocrinology,2017,13(5):278-288.

[19] 孟斌,刘福端.膳食补充剂对军事作业人员能力的影响研究进展[J].武警后勤学院学报(医学版),2018,27(8):702-706.MENG B,LIU F D.Effects of dietary supplement in military operation[J].Journal of Logistics University of PAP (Medical Sciences),2018,27(8):702-706.

[20] 惠伯棣,刘沐霖,庞善春,等.类胡萝卜素膳食补充剂[J].食品科学,2008,29(2):444-450.HUI B D,LIU M L,PANG S C,et al.Dietary supplements of carotenoids[J].Food Science,2008,29(2):444-450.

[21] 张秀娟,马骏池,赵晋彤,等.小檗碱对肠道菌群作用的研究进展[J].食品工业科技,2020,41(23):359-363.ZHANG X J,MA J C,ZHAO J T,et al.Advances on the effect of berberine on intestinal flora[J].Science and Technology of Food Industry,2020,41(23):359-363.

[22] 楚阳阳,张怡琳,游春苹.肠道微生物“暗物质” 与膳食营养对人体健康的影响研究进展[J].食品工业科技,2023,44(13):474-482.CHU Y Y,ZHANG Y L,YOU C P.Research progress on the impact of gut microbial “dark matter” and dietary nutrition on human health[J].Science and Technology of Food Industry,2023,44(13):474-482.

[23] 刘玉明,李旭霞,吕传禄,等.国外军队膳食补充剂应用现状分析及启示[J].军事医学,2023,47(6):422-426.LIU Y M,LI X X,LYU C L,et al.Current usage of dietary supplements in foreign military forces[J].Military Medical Sciences,2023,47(6):422-426.

[24] 刘翼翔,吴永沛,籍保平.蓝莓多酚在胃肠消化过程中的成分变化与抗氧化活性[J].中国食品学报,2016,16(10):197-203.LIU Y X,WU Y P,JI B P.Changes of component and antioxidative activity of blueberry polyphenols subjected to a simulated digestion process[J].Journal of Chinese Institute of Food Science and Technology,2016,16(10):197-203.

[25] 张中朋,李桂英.2019年中国膳食营养补充剂的行业现状及品类表现[J].精细与专用化学品,2020,28(11):1-6.ZHANG Z P,LI G Y.Industry status quo and category performance of vitamin &dietary supplements in China in 2019[J].Fine and Specialty Chemicals,2020,28(11):1-6.

[26] PASHKOV V М,SOLOVIOV O S,KHMELNYTSKA O A.Legal regulation of the circulation of dietary food and dietary supplements in eu countries:The experience of Germany[J].Wiadomosci Lekarskie,2024,77(12):2546-2553.

[27] 李桂英.国外膳食营养补充剂市场分析及监管制度研究:澳大利亚[J].精细与专用化学品,2023,31(7):12-15.LI G Y.Research on the market and regulatory system of dietary nutritional supplements in Australia[J].Fine and Specialty Chemicals,2023,31(7):12-15.

[28] 李桂英,王鹤松.国外膳食营养补充剂市场分析及监管制度研究:日本[J].精细与专用化学品,2024,32(2):7-9;12.LI G Y,WANG H S.Research on the market and regulatory system of dietary nutritional supplements in Japan[J].Fine and Specialty Chemicals,2024,32(2):7-9;12.

[29] 段珺,高振.基于文献专利计量的食品科技发展态势分析[J].中国农业科技导报,2021,23(8):114-126.DUAN J,GAO Z.Development status of food science and technology based on bibliometrics and patent metrology[J].Journal of Agricultural Science and Technology,2021,23(8):114-126.

[30] 陈振夏,吴莲张,李彦,等.基于Baiten专利数据库的草果食品专利格局分析[J].食品工业科技,2023,44(18):434-440.CHEN Z X,WU L Z,LI Y,et al.Analysis on food patent pattern of Amomum tsaoko based on baiten patent database[J].Science and Technology of Food Industry,2023,44(18):434-440.

Innovation in dietary supplements:A patent analysis using LDA

LIU Zhe1*,CAI Mengyuan1,QU Xianming2

1(School of Management,Henan University of Technology,Zhengzhou 450001,China)2(Strategic Consulting Center,Chinese Academy of Engineering,Beijing 100088,China)

ABSTRACT Dietary supplements can provide the nutrients the human body needs in a targeted manner.To deeply explore and analyze the patent information in nutritional supplements,observe technological dynamics,market trends,and potential innovation directions,this paper employs latent Dirichlet allocation (LDA) to conduct topic modeling analysis on patent literature.The study retrieved 7 873 patent documents from the HimmPat patent database up to 2024 and applied LDA to model the abstracts of these patents.The results indicate that the core technologies of dietary supplements focus on four themes:therapeutic efficacy,ingredients,nutrients,and microorganisms.With the advancement of scientific research and the changing consumer demands,the functions of dietary supplements have evolved towards more personalized and multifunctional directions.Using advanced technologies to extract bioactive compounds from natural foods has become a significant trend.

Key words LDA;dietary supplements;patent analysis;thematic clustering;trend analysis

DOI:10.13995/j.cnki.11-1802/ts.042557

引用格式:刘哲,蔡梦媛,屈贤明.基于LDA的膳食补充剂专利分析[J].食品与发酵工业,2025,51(23):328-336.LIU Zhe,CAI Mengyuan,QU Xianming.Innovation in dietary supplements:A patent analysis using LDA[J].Food and Fermentation Industries,2025,51(23):328-336.

第一作者:博士,教授(通信作者,E-mail:z.liu@haut.edu.cn)

基金项目:河南科技智库调研课题项目(HNKJZK-2025-02A);郑州市科技协同创新专项(21ZZXTCX27)

收稿日期:2025-02-28,改回日期:2025-04-28