Skip to content

Rejestrowanie i transkrypcja

Ekran rejestrowania otwiera się po kliknięciu „Rozpocznij sesję”. Nie ma paska bocznego — interfejs jest maksymalnie uproszczony, aby skupić uwagę na pacjencie.

  • Imię pacjenta z awatarem
  • Numer i typ sesji (np. „Sesja #12 — Terapia indywidualna”)
  • Automatycznie uruchamiany licznik czasu sesji

Centralny element ekranu:

ElementDziałanie
Przycisk RECStartuje / zatrzymuje rejestrowanie
Przycisk PAUSEWstrzymuje / wznawia (plik audio jest kontynuowany)
Fala dźwiękowaAnimacja amplitudy w czasie rzeczywistym
Licznik rejestracjiCzas od wciśnięcia REC
StatusRejestrowanie / Wstrzymane / Gotowe

Ikona przycisku zmienia się zależnie od trybu sesji:

  • 🎙️ mikrofon (mic_rounded) — sesja stacjonarna
  • 🖥️ screen share (screen_share_rounded) — sesja online

Gdy sesja ma flagę isOnline: true (zaznaczona przy planowaniu), MIND zamiast samego mikrofonu przechwytuje ekran z dźwiękiem systemowym ORAZ mikrofon. Pozwala to nagrać obie strony rozmowy z wideokonferencji (Google Meet, Teams, Zoom przeglądarkowy, …).

  1. Klikasz “Start” na sesji online
  2. Przeglądarka pokazuje picker udostępniania ekranu — wybierasz źródło
  3. Wybierasz: Tab (zalecane), Window lub Screen + zaznaczasz “Share audio”
  4. MIND prosi o dostęp do mikrofonu (jeśli jeszcze nie ma uprawnień)
  5. Oba źródła są łączone i przekazywane do silnika transkrypcji w czasie rzeczywistym
  6. Równolegle powstaje plik audio w oryginalnej jakości — wykorzystywany później do pełnej dokumentacji
  • Mikrofon — Twój głos (terapeuta)
  • Audio z udostępnionego ekranu/karty — głos pacjenta z wideokonferencji + ewentualne dźwięki systemowe
SytuacjaZachowanie
Odrzucasz udostępnienie ekranuPowiadomienie + automatyczny fallback do trybu mikrofonu
Udostępniasz ekran bez audioDziała z samym mikrofonem + powiadomienie info
Przeglądarka nie obsługuje udostępniania ekranu (iOS/Android)Tylko mikrofon, tryb ograniczony
PlatformaAudio z aplikacji w przeglądarceAudio z aplikacji desktopowej
Chrome / Edge — Windows / Linux✅ pełne✅ pełne
Chrome / Edge — macOS✅ udostępnienie karty⚠️ wymaga BlackHole
Safari — macOS❌ udostępnienie ekranu bez audio
iOS Safari, Android Chrome❌ udostępnianie ekranu niedostępne

macOS — konfiguracja dla aplikacji desktopowych

Section titled “macOS — konfiguracja dla aplikacji desktopowych”

Jeśli prowadzisz sesje online przez desktopową aplikację Zoom/Teams/FaceTime (a nie wersję webową), system macOS blokuje przechwytywanie audio z innych aplikacji bez wirtualnego sterownika.

Bezpłatna opcja: BlackHole

  1. Pobierz BlackHole 2ch → zainstaluj
  2. Otwórz Audio MIDI Setup (Finder → Aplikacje → Narzędzia)
  3. Utwórz Multi-Output Device zaznaczając BlackHole 2ch + Twoje słuchawki/głośniki
  4. Ustaw Multi-Output jako wyjście systemowe
  5. W picker’ze ekranu Chrome wybierz Multi-Output / BlackHole jako źródło audio

To pozwoli MIND przechwycić dźwięk z aplikacji desktopowych, jednocześnie nadal słysząc pacjenta przez słuchawki.

Płatna opcja: Loopback od Rogue Amoeba (~$110, prostszy interfejs).

Po prawej stronie (lub na dole na mobile) widoczna lista ostatnich 5 sesji pacjenta. Kliknięcie otwiera modal z treścią dokumentu T1 — bez przerywania rejestrowania.

Przycisk „Pokaż więcej” ładuje kolejne 5 sesji.

MIND działa jako PWA — możesz dodać ją do ekranu głównego na iPhone lub Androidzie.

Rejestrowanie na iOS działa przez Safari w wersji 14.3+. Jeśli nie startuje:

  1. Sprawdź, czy Safari ma dostęp do mikrofonu: Ustawienia → Safari → Mikrofon → Zezwól
  2. Upewnij się, że nie masz uruchomionej innej aplikacji używającej mikrofonu w tle
  3. Odśwież stronę i spróbuj ponownie

iOS nie pozwala na udostępnianie ekranu z poziomu przeglądarki — sesje online na iPhone/iPad rejestrują tylko mikrofon (tryb ograniczony).

Chrome na Androidzie obsługuje rejestrowanie audio w pełni. Przy pierwszej sesji zaakceptuj prośbę o mikrofon. Udostępnianie ekranu z poziomu przeglądarki na Androidzie jest niedostępne — sesje online działają w trybie tylko-mikrofon.

Transkrypt budowany jest online, fragment po fragmencie, na potrzeby analizy AI. Nie jest to pełna transkrypcja z interpunkcją.

W trybie online (ekran + mikrofon): oba głosy są łączone przed transkrypcją, więc zapis zawiera zarówno Twoje wypowiedzi, jak i pacjenta.

  1. Plik audio trafia do bezpiecznej chmury w UE.
  2. Automatycznie startuje zadanie transkrypcji z identyfikacją mówców — terapeuta vs. pacjent.
  3. Pełna transkrypcja z znacznikami czasu i etykietami mówców zapisywana do sesji.
  4. Dane trafiają do generatora dokumentów T1.
  5. Plik audio jest trwale usuwany po wygenerowaniu transkrypcji — pozostaje wyłącznie zaszyfrowany zapis tekstowy.

Czas transkrypcji: 2–5 minut dla 50-minutowej sesji.

Transkrypcja oznacza każdą wypowiedź etykietą Mówca A / Mówca B. MIND mapuje je na „Terapeuta” / „Pacjent” na podstawie statystyk (terapeuta zazwyczaj mówi krócej, rzadziej). To mapowanie możesz sprawdzić i skorygować w widoku analizy sesji.

Po kliknięciu przycisku „Zakończ sesję” (czerwony, prawy róg ekranu nagrywania) MIND:

  1. Wyświetla pełnoekranowy loader “Kończenie sesji…” z informacją „Wysyłam nagranie i zamykam pokój wideo. To może potrwać kilkanaście sekund — nie zamykaj karty.” — w tym czasie wszystkie kliknięcia są blokowane (nie da się przypadkowo kliknąć drugi raz)
  2. Czeka aż upload nagrania do chmury się zakończy (długie sesje 30+ min: kilkanaście sekund)
  3. Zamyka pokój wideokonferencji (jeśli sesja była online — rozłącza pacjenta z LiveKit)
  4. Zapisuje sesję w statusie „processing” (transkrypcja AI startuje automatycznie)
  5. Przenosi Cię do dashboardu

Od Maja 2026 MIND automatycznie zabezpiecza nagrywaną sesję przed utratą danych. Jeśli zamkniesz zakładkę przeglądarki, odświeżysz stronę (F5), padnie sieć podczas uploadu lub zawiesi się komputer — nagranie pozostaje bezpieczne i może być odzyskane.

Podczas nagrywania MIND co kilka sekund tworzy lokalną kopię bezpieczeństwa w pamięci przeglądarki. Po zakończeniu sesji i pomyślnym wgraniu pliku do chmury, lokalna kopia jest automatycznie usuwana.

Jeśli upload się nie powiedzie (np. brak sieci) lub aplikacja zostanie zamknięta przed zakończeniem — chunki audio pozostają na Twoim komputerze, gotowe do odzyskania.

Przy następnym uruchomieniu MIND, jeśli wykryje niezapisane nagranie, automatycznie pokaże dialog:

🔄 Wykryto niezapisane nagrania
Sesja abc12345… 14.05.2026, 14:00
Maria Kowalska · Terapia indywidualna
⏱ ~52 min 💾 13.4 MB 🎙️ Mikrofon
[ Odrzuć ] [ ☁ Wgraj teraz ]

Akcje:

  • Wgraj teraz — łączy chunki w plik audio i wgrywa do chmury. Po sukcesie sesja staje się dostępna w analizie tak jak normalna sesja, a lokalna kopia zostaje usunięta z przeglądarki.
  • Odrzuć — z dialogiem potwierdzenia trwale usuwa nagranie z lokalnego magazynu. Tej operacji nie można cofnąć.
  • Później — zamyka dialog. Nagranie zostaje na komputerze i będzie dostępne przy następnym uruchomieniu MIND.

Każda sesja zachowuje meta-informacje: nazwę pacjenta, typ sesji, datę, szacunkowy czas trwania i tryb (mikrofon vs. ekran online).

  • 🔒 Lokalna kopia jest przechowywana wyłącznie na Twoim urządzeniu — nigdy nie trafia do chmury bez Twojej zgody (kliknięcia “Wgraj teraz”)
  • 🛡️ Izolacja per użytkownik — jeśli z tego komputera korzysta inny specjalista, MIND pokaże tylko nagrania należące do aktualnie zalogowanego konta
  • ♻️ Automatyczne czyszczenie — po pomyślnym uploadzie lokalna kopia jest natychmiast usuwana (zwolnienie miejsca w przeglądarce)
  • 📦 Wolne miejsce — typowa 60-min sesja zajmuje ~14 MB. Przeglądarka ma do dyspozycji zwykle kilka GB lokalnej pamięci
PrzeglądarkaRecovery działa?Uwagi
Chrome / Edge✅ pełneChunki co 5s, recovery natychmiastowe
Firefox✅ pełnejw.
Safari macOS✅ pełnejw.
Safari iOS⚠️ częścioweNa starszych wersjach iOS Safari recovery działa tylko po prawidłowym zakończeniu sesji, a nie w trakcie nagrywania