生物序列专利检索是生命科学领域中一种独特的检索类型,需要借助专业工具和行业知识来完成。在我们之前的网络研讨会中,Questel 公司的 Juliane Wissuwa 分享了生物序列专利检索的有效技术,并强调了选择专业检索工具的优势。以下是她演讲要点的总结。
生物序列是由单个连续的核酸或氨基酸分子组成,形成 DNA/RNA 或蛋白质,并携带生物体发育、功能、生长和繁殖的指令信息。 生物序列包含酶、抗体、激素、抑制剂分子或基因改造定位分子(CRISPR/Cas)的信息。它们被各个行业和学术部门视为专利,包括制药行业、生物技术、农用化学品、食品和酶行业,以及技术转让办公室 (TTO) 和研发 (R&D) 机构。

这些专利不仅涵盖与药物相关的发明,如生物制剂、疫苗和药物,还包括诊断技术、生物催化剂(生物技术)、发酵技术、改良作物、动植物育种(农业)以及调味或增味剂分子(食品)等领域的创新。
然而,并不存在“标准”的生物序列专利,因为序列长度从几个残基到数百万个残基不等,专利可能仅涵盖一个小片段或整个基因组。
生物序列专利检索的独特挑战
尽管生物序列以连续的字母序列形式呈现(如上图所示),但在专利权利要求中,它们很少直接展示。通常,它们会被编号或展示在表格中(如下图所示,上部),或在附件中以表格或附录的形式引用。
此外,专利可以引用整个生物序列或其子序列,如下方示例所示,其中引用了特定的氨基酸残基:
最后,专利可能对生物序列提出权利要求,或仅为信息披露而公开。
生物序列专利检索的具体要点
“普通”专利检索属于语义检索,通过关键词、同义词结合布尔运算符、截断符和/或通配符来缩小检索范围。然而,这种检索方式不适用于生物序列专利检索,因为它会引发两个问题:
- 首先,如上所述,生物序列通常不会直接在专利文本中展示,而是作为补充材料/附件或嵌入表格中;
- 其次,生物序列中的字母可能存在细微变化,但这些变化不影响其功能,因此通过截断/通配符检索预测所有变化既困难又耗时。
相反,您需要一种专用工具,以便按照特定生物序列格式(FASTA)进行检索,并根据独特的生物序列参数(如长度)调整检索参数。
如何在Orbit Intelligence中进行生物序列专利检索
Orbit BioSequence是一种用于比较序列相似性的专用工具。如下图所示,它允许用户检索 FASTA 格式的生物序列(核酸或氨基酸),在多次检索中使用相同的序列类型,并根据特定生物序列调整检索参数,包括:
- 检索式长度:长/短/基序;
- 合适的数据库:核苷酸数据库或蛋白质数据库,或两者兼用,以获得最详尽的结果;
- 主题序列长度:限定长度以查找短序列作为引物(因为您可能无需检索整个基因组信息)。

如果检索结果数量较少,您可以手动审查。然而,许多生物序列专利检索会生成数百甚至数千条结果,因此Orbit BioSequence配备了专业过滤器,帮助消除干扰并精简或聚焦结果。
- 生物序列过滤器支持根据检索式或主题的匹配百分比、错误或缺口数量、主题或对齐长度进行筛选,同时可将检索范围限定在权利要求部分,从而仅展示对序列提出权利要求(而非引用)的专利。
- 专利过滤器可帮助您根据法律状态、申请年份和公开国家进行筛选,为自由实施检索提供支持。这样,您无需在全球范围内检索即可找到相同或相似的序列。
- 相关性过滤器允许您按关键词(语义)、国际专利分类(IPC)号、专利权人进行检索,甚至可提取涉及诉讼、异议、许可等的专利。
- 高级检索功能支持将生物序列检索与关键词检索相结合,在减少干扰的同时,确保保留有价值的生物序列信息。
免费与付费数据库——有何区别?
生物序列专利检索数据库分为免费和授权两种类型,但使用时需注意以下几点区别。
- 检索
免费数据库通常从特定网站获取生物序列专利信息,因此覆盖范围有限,且可能不是最新的。
付费数据库直接从专利局获取数据,因此其专利序列数据覆盖范围更广、准确性更高。 - 整合
免费数据库在根据专利信息过滤检索结果方面的选项有限,许多情况下几乎无法提供专利数据。
付费数据库提供了专为专利专业人士开发的高级过滤选项,包括关键词和全文检索的组合功能。 - 显示
免费数据库通常用户界面不够友好,且提供的序列匹配信息有限。
付费数据库提供了更直观、更全面的序列比对显示,使筛选过程更加容易。 - 数据导出
免费数据库在数据导出方面不够便捷,或提供的格式选项有限。
付费数据库提供了多种数据导出格式,并支持自定义报告功能。 - 技术支持
免费数据库虽然无需付费,但通常不提供任何技术支持。
付费数据库将额外的技术支持作为许可费的一部分,因此您可以向供应商提问、获取改进检索的指导,甚至在不确定或资源不足时要求他们为您执行检索。
生物序列专利检索最佳实践
要生成全面、准确且精准的生物序列专利检索结果,您需要同时掌握专利撰写和专利检索的具体细节。
使用专用的生物序列专利检索工具(例如Orbit BioSequence),您将获得所需的数据、检索参数和过滤器,从而获取并优化检索结果。
在检索生物序列数据时,同样重要的是需要考虑整个专利,以确保获得完整的检索结果。
最后,将现有技术检索任务外包给生物序列领域的主题专家,可为您提供额外支持。在您出具法律意见、提交申请或进行侵权抗辩之前,我们将为您找到所需的高质量检索结果。
要了解有关生物序列专利检索的更多信息,请观看我们的“超越传统的现有技术检索”网络研讨会、申请Orbit Biosequence的演示,或联系我们的主题专家。
