Python-Modul zum Durchsuchen von Patentdatenbanken, z. B. USPTO oder EPO

8

Für meine Arbeit muss ich potenzielle Kunden in der biomedizinischen Forschung und Industrie finden.

Ich habe einige ziemlich praktische Programme geschrieben, die das Modul biopython verwenden, das eine nette Schnittstelle für die Suche in NCBI bietet. Ich habe auch das clinical_trials-Modul verwendet, um clinicaltrials.gov zu suchen.

Ich möchte jetzt nach Patentdatenbanken wie EPO oder USPTO suchen, aber ich konnte nicht einmal die geringste Spur eines Python-Moduls finden. Aber vielleicht fehlt mir etwas offensichtlich?

Da Google eine Patentrechercheoption hat, habe ich mich gefragt, ob es vielleicht ein Python-Modul für die Google-Suche gibt, das nur für die Suche nach Patenten angepasst werden könnte?

    
Misconstruction 22.02.2013, 15:59
quelle

2 Antworten

11

Sie können analysieren, zumindest das USPTO jeden XML-Analyse-Tool wie das lxml Python-Modul.

Es gibt ein großes Papier auf tun dies nur durch Gabe Fierro, finden Sie hier: Extrahierung und Formatieren von Patentdaten aus USPTO XML (keine Paywall)

Gabe nahm auch an einige nützliche Diskussion über, dies zu tun hier auf dieser Google-Gruppe .

Wenn Sie schließlich wissen, wonach Sie suchen, und über ausreichend Speicherplatz verfügen, können Sie die Bulk-Daten auch lokal zur Verarbeitung speichern. USPTO-Bulk-Downloads hier .

Für weitere spezifische Fragen lassen Sie es mich wissen! Ich habe ein bisschen von diesem Grund vor:)

Auch ist das Google Patent Search API ist veraltet, aber Sie können nun die gleiche durchsuchen die wichtigsten Google-Suche-API URL-Tags tun (ich habe sie nicht praktisch, aber man kann sich mit der Suche über Google Patente findet die Antwort von google.com).

UPDATE: Zu Hause, die Flagge, die Sie die Google benutzerdefinierte Suche API für Patentrecherche verwenden möchten, ist & amp; tbm = pts - bitte beachten Sie, dass die Google benutzerdefinierte Suchmaschine und erhalten einen Code für die Suche sehr nützlich ist weil das gelieferte JSON eine schöne Datenstruktur mit patentspezifischen Feldern hat.

Beispielcode:

%Vor%

Dies wird (sobald Sie die freien API-Zugriffsinformationen hinzufügen) die ersten zehn Einträge von Patenten von Altera (als Beispiel) erfassen und das resultierende JSON in einer Textdatei speichern. Ziehen Sie Ihren bevorzugten Web-JSON-Editor hoch und sehen Sie sich die JSON-Datei an. Insbesondere empfehle ich in ['items'] [] und die Unter ['pagemap'] zu suchen. Gerade durch diese JSON Parsen können Sie Titel, Thumbnails, Schnipsel, Titel, Link, auch Zitierungen (wenn relevant) erhalten.

    
Ezekiel Kruglick 21.11.2013 23:15
quelle
-2

Ich kenne kein vorgefertigtes Python-Modul, aber Sie könnten Ihr eigenes bauen. Sowohl für das USPTO als auch für das EPA gibt es APIs, die unter Ссылка und Ссылка .

Ich kann nicht sagen, wie einfach die Dokumente von dort sind, aber Sie könnten versuchen, einen einfachen Querier zu erstellen, der Ergebnisse abruft und analysiert. Je umfangreicher die Daten sind, um die es geht, desto mehr Aufwand wird es wohl sein, ein Modul zu schreiben.

    
glormph 13.03.2013 09:38
quelle

Tags und Links