Projekte
Ich entwickle Open-Source-Tools für die linguistische Forschung, hauptsächlich in Python. Meine Software konzentriert sich auf Datenverwaltung, -analyse, -aufbereitung und -visualisierung, meistens mit Sprachdaten. Siehe mein GitHub-Profil für weitere Informationen.
Hauptprojekte
- TITUS 2.0 - Nächste Generation der TITUS-Datenbank für historische Linguistik und alte indoeuropäische Sprachen
- Schweizerdeutsches Dialektkorpus Karte - Räumliche Modellierung der im Idiotikon verwendeten Dialektgebiete und Integration in eine interaktive Suchkarte
- CDTD (Comparative Dictionary of Tibetan Dialects) - Rettung von Legacy-HyperCard-Daten und Vorbereitung der Publikation des zweiten Bandes
Projekte zu karibischen Sprachen
Meine Arbeit mit karibischen Sprachen umfasst Dokumentation, Analyse und die Entwicklung digitaler Ressourcen:
- Cariban Database - Umfassende Sammlung linguistischer Daten zu karibischen Sprachen, strukturiert als CLDF-Datensatz und bereitgestellt über eine CLLD-Webanwendung (Quellcode)
- Yawarana Digital Sketch Grammar - Digitale Grammatik des Yawarana, einer in Venezuela gesprochenen karibischen Sprache
- Yawarana Corpus (CLDF) - Strukturierter Korpusdatensatz
- Yawarana Morphologischer Parser - Computergestützte morphologische Analysewerkzeuge
Open-Source-Linguistikwerkzeuge
Dokumentenaufbereitung
- lingdocs – Erstellen datenreicher linguistischer Dokumente mit integriertem CLDF-Datensatz-Support und mehreren Ausgabeformaten
- expex-acro – LaTeX-Paket für Glossierung von Abkürzungen und linguistisches Markup
Korpusverwaltung & -analyse
- cldf-ldd – Sammlung von Komponenten für deskriptive linguistische Daten im CLDF-Format
- pyradigms – Erstellen und Analysieren linguistischer Paradigmen (einfach Pivot-Tabellen für Linguisten)
Datenkonvertierung & Integration
- unboxer – Extrahiert Daten aus Shoebox und Toolbox in CLDF-kompatible Formate
- cldflex – Konvertiert FLEx Daten in CLDF-kompatible Formate
Visualisierung & Kartierung
- lingtreemaps – Darstellung linguistischer Daten gleichzeitig auf phylogenetischen Bäumen und geografischen Karten
Hilfsprogramme
- humidifier – Erzeugt menschenlesbare IDs aus Zeichenketten
- biblatex2bibtex – Konvertiert BibLaTeX-Dateien ins BibTeX-Format