Projekte

Ich entwickle Open-Source-Tools für die linguistische Forschung, hauptsächlich in Python. Meine Software konzentriert sich auf Datenverwaltung, -analyse, -aufbereitung und -visualisierung, meistens mit Sprachdaten. Siehe mein GitHub-Profil für weitere Informationen.

Hauptprojekte

TITUS 2.0 - Nächste Generation der TITUS-Datenbank für historische Linguistik und alte indoeuropäische Sprachen
Schweizerdeutsches Dialektkorpus Karte - Räumliche Modellierung der im Idiotikon verwendeten Dialektgebiete und Integration in eine interaktive Suchkarte
CDTD (Comparative Dictionary of Tibetan Dialects) - Rettung von Legacy-HyperCard-Daten und Vorbereitung der Publikation des zweiten Bandes

Projekte zu karibischen Sprachen

Meine Arbeit mit karibischen Sprachen umfasst Dokumentation, Analyse und die Entwicklung digitaler Ressourcen:

Cariban Database - Umfassende Sammlung linguistischer Daten zu karibischen Sprachen, strukturiert als CLDF-Datensatz und bereitgestellt über eine CLLD-Webanwendung (Quellcode)
Yawarana Digital Sketch Grammar - Digitale Grammatik des Yawarana, einer in Venezuela gesprochenen karibischen Sprache
Yawarana Corpus (CLDF) - Strukturierter Korpusdatensatz
Yawarana Morphologischer Parser - Computergestützte morphologische Analysewerkzeuge

Open-Source-Linguistikwerkzeuge

Dokumentenaufbereitung

lingdocs – Erstellen datenreicher linguistischer Dokumente mit integriertem CLDF-Datensatz-Support und mehreren Ausgabeformaten
expex-acro – LaTeX-Paket für Glossierung von Abkürzungen und linguistisches Markup

Korpusverwaltung & -analyse

cldf-ldd – Sammlung von Komponenten für deskriptive linguistische Daten im CLDF-Format
pyradigms – Erstellen und Analysieren linguistischer Paradigmen (einfach Pivot-Tabellen für Linguisten)

Datenkonvertierung & Integration

unboxer – Extrahiert Daten aus Shoebox und Toolbox in CLDF-kompatible Formate
cldflex – Konvertiert FLEx Daten in CLDF-kompatible Formate

Visualisierung & Kartierung

lingtreemaps – Darstellung linguistischer Daten gleichzeitig auf phylogenetischen Bäumen und geografischen Karten

Hilfsprogramme

humidifier – Erzeugt menschenlesbare IDs aus Zeichenketten
biblatex2bibtex – Konvertiert BibLaTeX-Dateien ins BibTeX-Format