Kevin Klein (medium)
01. Apr. 2026
00:0000:00
Zusammenfassung
Teilnehmer: Kevin, Frank
- Audio-Chunking (5-Minuten-Segmente) für große Dateien
- Video-Support durch Audio-Extraktion
Aufwand: 3 Wochen intensiv
Features:
Neues Tool: Sprachnotiz-Transkription und -Zusammenfassung
Tool-Features
- Funktionsweise: Sprachnotizen aufnehmen → automatische Transkription → KI-gestützte Zusammenfassung
- Performance: 6-Minuten-Nachricht in 1,5 Minuten verarbeitet, 8-Minuten-Feedback (2000 Wörter) in 3 Minuten
- Erkennung: Automatisches Herausfiltern von Füllwörtern und irrelevantem Content
- Strukturierung: To-Dos vs. reine Informationen werden differenziert
Anwendungsszenarien
- Sabrina's Feedback-Nachrichten: 8-Minuten-Sprachnachrichten effizient zusammenfassen
- Meeting-Protokolle: Automatische Zusammenfassungen für 3-Personen-Gespräche
- Content-Erstellung: Gesprochene Inhalte zu strukturierten Artikeln verarbeiten
- Projekt-Erstbesprechungen: Strukturierte Dokumentation statt manueller Notizen
Technische Herausforderungen
- SQLite-Deployment: Probleme bei Windows/Linux-Binaries
- Speaker-Erkennung: Whisper erkennt nicht automatisch verschiedene Sprecher
- Lösungsansätze:
- Audio-Chunking (5-Minuten-Segmente) für große Dateien
- Video-Support durch Audio-Extraktion
Verkaufspotential
- Biotop-Projekt: Tool als zusätzliche Lösung anbieten
- Allgemeine Vermarktung: Zeitersparnis für Meetings und Feedback-Schleifen
Terminverwaltungs-App (Rückblick Q1)
Aufwand: 3 Wochen intensiv
Features:
- Magic-Link-Authentifizierung für Einrichtungen
- Termin-Eingabe durch einzelne Einrichtungen
- Zentrale Freigabe und Website-Integration
Server-Infrastruktur
GPU-Hosting Überlegungen
- Hetzner GPU-Server: Ab 254€/Monat (RTX 4000 SFF, 20GB VRAM, 2TB Storage)
- Mitwald AI-Hosting: Token-basierte Abrechnung verfügbar
- Whisper Large V3 Turbo: Als Hosting-Option erkannt
AI-Entwicklungen
- Claude Deep Sleep: Selbst-optimierende Kontextverwaltung
- Notebook-LM: Projekt-Research und Visualisierungen aus Gesprächen
- Spekulationen: Neues Modell von Anthropic vor Börsengang
Offene Punkte
- Whisper-X für Speaker-Differenzierung testen
- Video-Transkription implementieren
- GPU-Hosting für AI-Workloads evaluieren
11674 TOKENS$0.0446