OBS:从简单的专利序列检索到变异分析
自 60 年代以来,DNA、RNA 序列以及蛋白质已在专利中公开,甚至更早一些。随着时间的推移,已经制定和修改了许多法律,以允许不同类型的生物材料获得专利,例如天然存在的序列、修饰的序列、用于诊断的序列、植物序列和许多其他类型。我们最近看到疫苗是一个热门话题,有些疫苗(例如 RNA 疫苗)确实包含序列。发布序列的工业领域似乎令人惊讶,但食品工业或洗涤剂制造商就是其中的一部分。显然,制药业、生物技术、农化和种子公司产生了大量的序列专利。那么,为什么专利序列检索很重要,为什么它与其他类型的专利检索不同?
专利序列数据
从 90 年代开始,人类基因组计划、基因组和 mRNA 序列开始在专利中变得更加普遍。在某些情况下,可以由数百万个碱基对组成的整个基因组(来自细菌、真菌)被发表。私营公司披露并在某些情况下声称拥有数百万个短序列。当所有专利都纯粹以纸质形式提交时,所有这一切都会发生。部分由于序列专利,专利和补充材料(如序列表)的电子申请最终变得可用。从那以后,我们看到带序列的专利数量在增加,尽管中国专利数量大幅增加,但全球新公布的带序列专利数量仍然呈线性曲线。
Orbit BioSequence 提供 2000 年至 2020 年新发表序列专利的历史趋势。
历史上的三大机构(美国专利商标局、欧洲专利局和世界知识产权组织)公布了他们的序列。其他一些机构非常合规,例如 JPO、KIPO 和 CIPO。不幸的是,其他人则不太系统化或停留在过去。但即使对于高度合规的当局,关于应披露哪些序列的规则和法律也各不相同。因此,强烈建议您对您的专利有家族观点,因为 EPO 文件中的序列专利可能与同一家族的 USPTO 或 WIPO 文件中的序列专利不同。
为什么专利序列搜索不同?
传统的 IP 搜索是通过关键字完成的。由于关键字搜索不完善,它们通常与专利类别、同义词列表和许多其他功能相结合,这些功能基本上是为了减轻关键字不准确所带来的痛苦。
生物序列搜索因多种原因而不同。首先,有一种共同的语言来描述 DNA/RNA 和氨基酸序列,完全独立于专利所用的母语。因此,不需要自然语言翻译。
其次,由于序列可能很长,随着时间的推移出现了几种出版标准,在序列表中将它们分开处理。因此,绝大多数已发布的序列都易于电子处理。这可以与化学形成对比,在化学中图像仍然是一种可接受的出版形式。
第三,除非你的序列很短,否则你总是希望找到与你的相似的序列,而不仅仅是相同的。这一点特别重要,因为可以以某种方式控制小错误(OCR 错误、出版商错误)。相比之下,如果您搜索关键字“bread yeast”,则不会找到“bead yeast”,即使后者可能是拼写错误。
第四,在过去 20 年左右的时间里,专利中公布的序列被编号并通过关键词 SEQ ID NO.在大多数情况下很容易知道,比方说,命中序列 5 是否被要求保护,因为它在权利要求部分被称为 SEQ ID NO。 5. 这是序列的一个独特特征,也是一个非常重要的特征,它允许我们将序列实例突出显示为(声称的)实例。
与出现在三份美国专利商标局文件中的序列比对的序列,无论是否在 Orbit BioSequence 中声明。
路线和算法
专利序列搜索包括使用特定算法和参数将您的查询序列与数据库中的序列进行比对。这一切都非常复杂,但是,它可以限制在一些用例中。冒着将问题过于简单化的风险,要么使用长基因序列来查找相似序列,要么使用短序列。对于前者,一切正常,只需确保将您的基因与核苷酸和蛋白质数据库进行比较,因为您事先不知道专利可以要求或披露什么。在后一种短序列的情况下,事情要困难一些。您可能希望找到与您的查询完全匹配或允许一些不匹配的序列。你想允许间隙吗?如果您使用 3 或 6 个抗体 CDR,您是否希望全部与其他 CDR、重链或轻链对齐?所有这些问题都可能导致不同的算法和参数。但请放心,我们有大量的文档和强大的服务台。复杂的问题并不总能导致简单的解决方案!
成对与变体多序列比对
最终,您将看到成对比对,换句话说,您的查询序列与专利序列比对。这将为您提供两个序列之间差异的复杂细节,并结合可用的专利信息,将帮助您确定这种比对是否与您的 FTO、可专利性等相关……事实上,同一个序列中可能有很多序列专利家族和许多家族。您将需要浏览很多,但我们可以帮助您使用过滤器,这些过滤器只会导致最相关的路线和系列。但是,您将错过路线的全局视图。有多少专利序列在您查询的第 34 位有赖氨酸?这只能通过变异分析来完成。
变体分析将堆叠与您的查询对齐的所有专利序列,并为您提供每个查询位置的全局视图。换句话说,它将根据您的查询序列创建多重比对。您可以查询、修改和导出数据集,最重要的是,探索各种变化,让您对竞争对手的行为或从未修改过的领域有新的认识。
使用 Orbit BioSequence 变异分析在多个位置进行变异
轨道生物序列 (OBS)
Orbit BioSequence可以广泛访问专利序列和非专利序列,是您进行 FTO、专利性和商业智能搜索的完美工具。通过轻松组合专利数据和序列,OBS 将使您的专利序列搜索比其他专门用于序列的工具更容易。抗体和CDR、基因、引物都可以使用、组合和探索。
有兴趣了解更多吗?如需具体建议或支持,请联系我们,或观看我们最近的网络研讨会录像Orbit BioSequence 在专利数据中的智能和视觉序列变异浏览器。