Rejestrowanie i transkrypcja

Ekran rejestrowania sesji

Ekran rejestrowania otwiera się po kliknięciu „Rozpocznij sesję”. Nie ma paska bocznego — interfejs jest maksymalnie uproszczony, aby skupić uwagę na pacjencie.

Imię pacjenta z awatarem
Numer i typ sesji (np. „Sesja #12 — Terapia indywidualna”)
Automatycznie uruchamiany licznik czasu sesji

Panel rejestrowania

Centralny element ekranu:

Element	Działanie
Przycisk REC	Startuje / zatrzymuje rejestrowanie
Przycisk PAUSE	Wstrzymuje / wznawia (plik audio jest kontynuowany)
Fala dźwiękowa	Animacja amplitudy w czasie rzeczywistym
Licznik rejestracji	Czas od wciśnięcia REC
Status	Rejestrowanie / Wstrzymane / Gotowe

Ikona przycisku zmienia się zależnie od trybu sesji:

🎙️ mikrofon (mic_rounded) — sesja stacjonarna
🖥️ screen share (screen_share_rounded) — sesja online

Sesje online — przechwytywanie ekranu

Gdy sesja ma flagę isOnline: true (zaznaczona przy planowaniu), MIND zamiast samego mikrofonu przechwytuje ekran z dźwiękiem systemowym ORAZ mikrofon. Pozwala to nagrać obie strony rozmowy z wideokonferencji (Google Meet, Teams, Zoom przeglądarkowy, …).

Jak to działa

Klikasz “Start” na sesji online
Przeglądarka pokazuje picker udostępniania ekranu — wybierasz źródło
Wybierasz: Tab (zalecane), Window lub Screen + zaznaczasz “Share audio”
MIND prosi o dostęp do mikrofonu (jeśli jeszcze nie ma uprawnień)
Oba źródła są łączone i przekazywane do silnika transkrypcji w czasie rzeczywistym
Równolegle powstaje plik audio w oryginalnej jakości — wykorzystywany później do pełnej dokumentacji

Co rejestrujemy

Mikrofon — Twój głos (terapeuta)
Audio z udostępnionego ekranu/karty — głos pacjenta z wideokonferencji + ewentualne dźwięki systemowe

Fallback gdy coś pójdzie nie tak

Sytuacja	Zachowanie
Odrzucasz udostępnienie ekranu	Powiadomienie + automatyczny fallback do trybu mikrofonu
Udostępniasz ekran bez audio	Działa z samym mikrofonem + powiadomienie info
Przeglądarka nie obsługuje udostępniania ekranu (iOS/Android)	Tylko mikrofon, tryb ograniczony

Wsparcie per platforma

Platforma	Audio z aplikacji w przeglądarce	Audio z aplikacji desktopowej
Chrome / Edge — Windows / Linux	✅ pełne	✅ pełne
Chrome / Edge — macOS	✅ udostępnienie karty	⚠️ wymaga BlackHole
Safari — macOS	❌ udostępnienie ekranu bez audio	❌
iOS Safari, Android Chrome	❌ udostępnianie ekranu niedostępne	❌

macOS — konfiguracja dla aplikacji desktopowych

Jeśli prowadzisz sesje online przez desktopową aplikację Zoom/Teams/FaceTime (a nie wersję webową), system macOS blokuje przechwytywanie audio z innych aplikacji bez wirtualnego sterownika.

Bezpłatna opcja: BlackHole

Pobierz BlackHole 2ch → zainstaluj
Otwórz Audio MIDI Setup (Finder → Aplikacje → Narzędzia)
Utwórz Multi-Output Device zaznaczając BlackHole 2ch + Twoje słuchawki/głośniki
Ustaw Multi-Output jako wyjście systemowe
W picker’ze ekranu Chrome wybierz Multi-Output / BlackHole jako źródło audio

To pozwoli MIND przechwycić dźwięk z aplikacji desktopowych, jednocześnie nadal słysząc pacjenta przez słuchawki.

Płatna opcja: Loopback od Rogue Amoeba (~$110, prostszy interfejs).

Historia poprzednich sesji

Po prawej stronie (lub na dole na mobile) widoczna lista ostatnich 5 sesji pacjenta. Kliknięcie otwiera modal z treścią dokumentu T1 — bez przerywania rejestrowania.

Przycisk „Pokaż więcej” ładuje kolejne 5 sesji.

Obsługa na urządzeniach mobilnych

MIND działa jako PWA — możesz dodać ją do ekranu głównego na iPhone lub Androidzie.

iPhone / iOS Safari

Rejestrowanie na iOS działa przez Safari w wersji 14.3+. Jeśli nie startuje:

Sprawdź, czy Safari ma dostęp do mikrofonu: Ustawienia → Safari → Mikrofon → Zezwól
Upewnij się, że nie masz uruchomionej innej aplikacji używającej mikrofonu w tle
Odśwież stronę i spróbuj ponownie

iOS nie pozwala na udostępnianie ekranu z poziomu przeglądarki — sesje online na iPhone/iPad rejestrują tylko mikrofon (tryb ograniczony).

Android

Chrome na Androidzie obsługuje rejestrowanie audio w pełni. Przy pierwszej sesji zaakceptuj prośbę o mikrofon. Udostępnianie ekranu z poziomu przeglądarki na Androidzie jest niedostępne — sesje online działają w trybie tylko-mikrofon.

Transkrypcja

Live (podczas rejestrowania)

Transkrypt budowany jest online, fragment po fragmencie, na potrzeby analizy AI. Nie jest to pełna transkrypcja z interpunkcją.

W trybie online (ekran + mikrofon): oba głosy są łączone przed transkrypcją, więc zapis zawiera zarówno Twoje wypowiedzi, jak i pacjenta.

Offline (po zakończeniu)

Plik audio trafia do bezpiecznej chmury w UE.
Automatycznie startuje zadanie transkrypcji z identyfikacją mówców — terapeuta vs. pacjent.
Pełna transkrypcja z znacznikami czasu i etykietami mówców zapisywana do sesji.
Dane trafiają do generatora dokumentów T1.
Plik audio jest trwale usuwany po wygenerowaniu transkrypcji — pozostaje wyłącznie zaszyfrowany zapis tekstowy.

Czas transkrypcji: 2–5 minut dla 50-minutowej sesji.

Identyfikacja mówców

Transkrypcja oznacza każdą wypowiedź etykietą Mówca A / Mówca B. MIND mapuje je na „Terapeuta” / „Pacjent” na podstawie statystyk (terapeuta zazwyczaj mówi krócej, rzadziej). To mapowanie możesz sprawdzić i skorygować w widoku analizy sesji.

Język sesji (multilanguage)

Od maja 2026 MIND/MED obsługuje transkrypcję w 5 językach: polski, angielski, niemiecki, francuski i hiszpański. Język jest wymuszany twardo dla obu silników transkrypcji (live + offline) — model nie zgaduje, tylko transkrybuje w wybranym języku.

Gdzie ustawić:

Poziom	Gdzie	Co robi
Domyślny dla wszystkich sesji	Ustawienia → Profil → Język sesji	Stosowany dla nowych sesji jeśli nie wybrano inaczej
Per sesja (override)	Dialog planowania sesji (Dashboard / Kalendarz / Patient Insight) → pole “Język sesji”	Nadpisuje ustawienie domyślne tylko dla tej konkretnej sesji

Łańcuch pierwszeństwa: ustawienie per sesja → preferencja domyślna → polski (fallback).

Wsparcie modeli:

Live (Deepgram Nova-3) i offline (AssemblyAI Universal-2) — oba silniki obsługują wszystkie 5 języków
AssemblyAI uruchamia tryb medical-v1 (rozszerzona terminologia medyczna) tylko dla języka angielskiego — pozostałe języki używają standardowego modelu z dobrą jakością medyczną
Etykiety mówców dostosowane do języka: „Pacjent / Specjalista” (PL), „Patient / Therapist” (EN), „Patient / Therapeut” (DE), „Patient / Thérapeute” (FR), „Paciente / Terapeuta” (ES)

Zakończenie sesji

Po kliknięciu przycisku „Zakończ sesję” (czerwony, prawy róg ekranu nagrywania) MIND:

Wyświetla pełnoekranowy loader “Kończenie sesji…” z informacją „Wysyłam nagranie i zamykam pokój wideo. To może potrwać kilkanaście sekund — nie zamykaj karty.” — w tym czasie wszystkie kliknięcia są blokowane (nie da się przypadkowo kliknąć drugi raz)
Czeka aż upload nagrania do chmury się zakończy (długie sesje 30+ min: kilkanaście sekund)
Zamyka pokój wideokonferencji (jeśli sesja była online — rozłącza pacjenta z LiveKit)
Zapisuje sesję w statusie „processing” (transkrypcja AI startuje automatycznie)
Przenosi Cię do dashboardu

Odzyskiwanie nagrań po awarii (Recovery)

Od Maja 2026 MIND automatycznie zabezpiecza nagrywaną sesję przed utratą danych. Jeśli zamkniesz zakładkę przeglądarki, odświeżysz stronę (F5), padnie sieć podczas uploadu lub zawiesi się komputer — nagranie pozostaje bezpieczne i może być odzyskane.

Jak to działa

Podczas nagrywania MIND co kilka sekund tworzy lokalną kopię bezpieczeństwa w pamięci przeglądarki. Po zakończeniu sesji i pomyślnym wgraniu pliku do chmury, lokalna kopia jest automatycznie usuwana.

Jeśli upload się nie powiedzie (np. brak sieci) lub aplikacja zostanie zamknięta przed zakończeniem — chunki audio pozostają na Twoim komputerze, gotowe do odzyskania.

Dialog odzyskiwania

Przy następnym uruchomieniu MIND, jeśli wykryje niezapisane nagranie, automatycznie pokaże dialog:

🔄 Wykryto niezapisane nagrania

Sesja abc12345…                          14.05.2026, 14:00
Maria Kowalska · Terapia indywidualna
⏱ ~52 min   💾 13.4 MB   🎙️ Mikrofon

[ Odrzuć ]                       [ ☁ Wgraj teraz ]

Akcje:

Wgraj teraz — łączy chunki w plik audio i wgrywa do chmury. Po sukcesie sesja staje się dostępna w analizie tak jak normalna sesja, a lokalna kopia zostaje usunięta z przeglądarki.
Odrzuć — z dialogiem potwierdzenia trwale usuwa nagranie z lokalnego magazynu. Tej operacji nie można cofnąć.
Później — zamyka dialog. Nagranie zostaje na komputerze i będzie dostępne przy następnym uruchomieniu MIND.

Każda sesja zachowuje meta-informacje: nazwę pacjenta, typ sesji, datę, szacunkowy czas trwania i tryb (mikrofon vs. ekran online).

Bezpieczeństwo

🔒 Lokalna kopia jest przechowywana wyłącznie na Twoim urządzeniu — nigdy nie trafia do chmury bez Twojej zgody (kliknięcia “Wgraj teraz”)
🛡️ Izolacja per użytkownik — jeśli z tego komputera korzysta inny specjalista, MIND pokaże tylko nagrania należące do aktualnie zalogowanego konta
♻️ Automatyczne czyszczenie — po pomyślnym uploadzie lokalna kopia jest natychmiast usuwana (zwolnienie miejsca w przeglądarce)
📦 Wolne miejsce — typowa 60-min sesja zajmuje ~14 MB. Przeglądarka ma do dyspozycji zwykle kilka GB lokalnej pamięci

Wsparcie per platforma

Przeglądarka	Recovery działa?	Uwagi
Chrome / Edge	✅ pełne	Chunki co 5s, recovery natychmiastowe
Firefox	✅ pełne	jw.
Safari macOS	✅ pełne	jw.
Safari iOS	⚠️ częściowe	Na starszych wersjach iOS Safari recovery działa tylko po prawidłowym zakończeniu sesji, a nie w trakcie nagrywania

Rejestrowanie i transkrypcja

Ekran rejestrowania sesji

Header

Panel rejestrowania

Sesje online — przechwytywanie ekranu

Jak to działa

Co rejestrujemy

Fallback gdy coś pójdzie nie tak

Wsparcie per platforma

macOS — konfiguracja dla aplikacji desktopowych

Historia poprzednich sesji

Obsługa na urządzeniach mobilnych

iPhone / iOS Safari

Android

Transkrypcja

Live (podczas rejestrowania)

Offline (po zakończeniu)

Identyfikacja mówców

Język sesji (multilanguage)

Zakończenie sesji

Odzyskiwanie nagrań po awarii (Recovery)

Jak to działa

Dialog odzyskiwania

Bezpieczeństwo

Wsparcie per platforma