
Gepostet vom Google Dev Library-Team
Wir stellen die Dev Library Contributor Spotlights vor – eine Blogserie, die Entwickler hervorhebt, die das blühende Entwicklungsökosystem unterstützen, indem sie ihre Ressourcen und Tools beisteuern Google-Entwicklerbibliothek.
Wir trafen uns mit Doug DuhaimeFull-Stack-Entwickler im Digital Humanities Lab der Yale University, um über seine Leidenschaft für maschinelles Lernen, seine Prozesse und seine Inspiration für die Veröffentlichung seines PixPlot-Projekts als Open Source zu sprechen.
Was hat Sie dazu gebracht, sich mit dem Bereich des maschinellen Lernens auseinanderzusetzen?
Ich war Englischmajor im Grundstudium und in der Graduiertenschule. Ich habe in englischer Literatur promoviert. Meine Dissertation befasste sich mit der Geschichte des Urheberrechts und den Auswirkungen von Änderungen im Urheberrecht auf den Buchmarkt. Wie beeinflusst die Institution des zeitlich befristeten Urheberrechts den Buchmarkt? Um diese Frage zu beantworten, musste ich eine enorme Datensammlung durchsuchen – eine halbe Million Bücher, die vor 1800 veröffentlicht wurden –, um mir verschiedene Muster anzusehen. Das war eines der Schlüsselprojekte, das mich dazu inspiriert hat, die Welt des maschinellen Lernens weiter zu erkunden.
Tatsächlich ist eines meiner Projekte – die PixPlot-Bibliothek – verwendet Computer Vision, um Bildsammlungen zu analysieren, was teilweise auch in meiner Forschung verwendet wurde. Ein Teil meiner Forschung befasste sich mit der Erkennung von Plagiaten und wie bereitwillig Menschen dazu neigen, Bilder zu kopieren, sobald es legal ist, sie aus anderen Texten zu kopieren. Computer Vision hilft uns, diese Fragen zu beantworten und Schlüsselmuster zu identifizieren.
Ich habe maschinelles Lernen und Programmieren als eine Möglichkeit gesehen, neue Fragen in historischen Kontexten zu stellen. Und es gibt ein ganzes Feld von uns – wir nennen uns digitale Humanisten. Die Yale University, an der ich seit fünf Jahren arbeite, hat ein fantastisches Programm für digitale Geisteswissenschaften, in dem Forscher Fragen wie diese stellen und unterhaltsame Plattformen für maschinelles Lernen wie TensorFlow verwenden, um diese Fragen zu beantworten.
![]() |
Können Sie uns mehr über die Entwicklung Ihres PixPlot-Bibliotheksprojekts erzählen?
Wir haben im Digital Humanities Lab von Yale mit einem Projekt namens „Neural Neighbors“ begonnen. Und die Idee war hier, Muster in der Meserve-Kunhardt-Sammlung von Bildern zu finden.
Meserve-Kunhardt ist eine Sammlung von Fotografien, die größtenteils aus dem 19. Jahrhundert stammen und die Yale kürzlich erworben hat. Nachdem sie von der Universität erworben worden waren, bereiteten sich einige Kuratoren darauf vor, all diese wirklich reichhaltigen Metadaten zu identifizieren, um diese Bilder zu beschreiben. Sie hatten jedoch einen Rückstand und brauchten Hilfe, um zu versuchen, den Inhalt dieser Sammlung zu verstehen. Neural Neighbors war also unser erster Versuch, diese Frage zu beantworten.
Im Laufe des Projekts stießen wir auf Grenzen und stellten größere Fragen. Wie wäre es zum Beispiel, anstatt sich nur die Bilder anzusehen, die gesamte Kollektion auf einmal zu betrachten? Um diese Frage zu beantworten, brauchten wir eine performantere Rendering-Ebene.
Also entschieden wir uns für TensorFlow, mit dem wir die Vektordarstellung jedes Bildes extrahieren konnten. Wir haben dann die Dimensionalität dieser Vektoren auf 2D komprimiert. Aber für PixPlot haben wir uns entschieden, eine andere Technik zur Reduzierung der Dimensionalität namens umap zu verwenden. Und das brachte uns zur ersten Version von PixPlot.
Die Idee hier war, die gesamte Sammlung zu nehmen, sie in 2D herunterzuschießen und Sie dann durch sie hindurchgehen und die Bilder in der Sammlung betrachten zu lassen, wobei wir davon ausgehen, dass Bilder mit ähnlichem Inhalt nahe beieinander platziert werden.
Und so hat es sich einfach von dieser frühen Genese und Neural Neighbors bis zu dem entwickelt, wo es heute ist.
Was hat Sie dazu inspiriert, PixPlot als Open-Source-Projekt zu veröffentlichen?
Im Fall von PixPlot arbeitete ich für die Yale University, und wir hatten das Ziel, so viele unserer Beiträge zur Softwarewelt wie möglich offen und ohne kommerzielle Bedingungen öffentlich zugänglich zu machen.
Es war ein großes Privileg, Zeit mit dem Labor zu verbringen und Software zu entwickeln, die andere nützlich fanden. Ich würde noch allgemeiner sagen, dass ich es in meinem Privatleben wirklich mag, Dinge zu bauen, die die Leute nützlich finden, und, wenn möglich, einen Beitrag zur Open-Source-Welt zu leisten, weil ich denke, dass so viele von uns von Open Source lernen.
![]() |
Erfahren Sie mehr über beigetragene und verfasste Inhalte von Doug Duhaime und entdecken Sie weitere einzigartige Tools und Ressourcen auf der Google-Entwicklerbibliothek Webseite!