Neural Patent Classification beyond Title and Abstract: Leveraging Patent Text and Metadata

  • Termin in der Vergangenheit
  • Dienstag, 30. Juli 2024, 14:00 Uhr
  • SR 1 (02.101)
    • Subhash Chandra Pujari
  • Adresse

    Seminarraum 1 (02.101)

  • Veranstalter

  • Veranstaltungstyp

Verstöße gegen geistige Eigentumsrechte ziehen erhebliche Prozess- und Lizenzkosten nach sich und betonen die Notwendigkeit effizienter Patentsuchsysteme. Bei Millionen existierender Patente sind manuelle Suchvorgänge unpraktisch, was den Einsatz automatisierter Klassifikationstechniken erforderlich macht. Die im Rahmen dieser Arbeit durchgeführte Forschung verbessert die Systeme der kooperativen Patentklassifikation (CPC) und der internationalen Patentklassifikation (IPC), wodurch die Weiterleitung der Patentanmeldungen und die Recherche nach dem Stand der Technik in Patentämtern verbessert werden. Zudem werden Patent Landscape Study (PLS) Klassifikationen behandelt, die es Organisationen ermöglichen, Patente zu kategorisieren und zu analysieren, um wertvolle Erkenntnisse zu gewinnen.

Zu den wichtigsten Beiträgen dieser Arbeit gehört die Veröffentlichung eines umfassenden CPC-Klassifikationsdatensatzes mit vollständigen Patenttexten, um die Einschränkungen bestehender Datensätze zu überwinden. Darüber hinaus werden drei Open-Source-Datensätze kuratiert und veröffentlicht, die die Automatisierung von PLS ermöglichen. Zur Bewältigung der hierarchischen Multi-Label-Natur der CPC/IPC-Klassifikation, die Hunderte von Labels umfasst, wird eine speichereffiziente Modellarchitektur entwickelt. Diese Architektur verwendet ein einziges Transformer-basiertes Sprachmodell für mehrere Klassifikationsköpfe, was die Leistung insbesondere bei seltenen Labels erheblich verbessert.

Darüber hinaus schlagen wir eine neuartige Technik zur Dokumentenrepräsentation vor, die gekürzte Textabschnitts-Einbettungen mithilfe der Vektoraddition kombiniert und damit bestehende Methoden übertrifft. Für PLS bereichern wir die Dokumentenrepräsentation, indem wir CPC/IPC-Labels mit Patenttexten kombinieren, um PLS-orientierte Kategorien vorherzusagen. Die breitere Anwendbarkeit der vorgeschlagenen Techniken wird durch die Klassifikation von Forschungsarbeiten demonstriert, was deren Vielseitigkeit und Effektivität unterstreicht.