7 tips untuk biosignals sebelum proses: bagaimana untuk meningkatkan kekukuhan pengelas Deep Learning anda

Mengapa berurusan dengan bunyi dan gangguan adalah sangat penting

Biasanya, sebarang tugas klasifikasi (pengesanan ketidaksamaan), yang berkaitan dengan biosignals, seperti Electrocardiography (ECG), Electroencephalography (EEG), Electromyography (EMG), dan sebagainya boleh dipertimbangkan sebagai masalah pengiktirafan masa-siri.

Menurut syarat Karush-Kuhn-Tucker, isyarat input sepadan dengan kriteria stesen. Ringkasnya, corak isyarat masukan mestilah sama atau sama seperti dalam satu set latihan tanpa mengubah pengedaran isyarat dari masa ke masa.

Biasanya, mana-mana rakaman biosignals terdedah dengan banyak bunyi. Gangguan ini memasukkan varians tambahan ke dalam model kerana melanggar kriteria stesen.

Ini bunyi mungkin mempunyai sifat yang berbeza dan maklumat yang lebih spesifik yang anda dapati di sini dan di sini. Artikel ini menggambarkan bunyi ECG, tetapi ia juga boleh digunakan untuk mana-mana biosignals.

Ini bermakna, prestasi keseluruhan pengeluar DL anda ditakrifkan oleh kecekapan teknik pra-pemprosesan.

Mari kita perhatikan, bagaimana, praktikal, adalah mungkin untuk meningkatkan keteguhan model pembelajaran mendalam dengan pra-proses.

1. 50% daripada pemprosesan isyarat digital yang cekap adalah pemprosesan analog yang cekap

Mana-mana pemprosesan isyarat digital bermula dengan penyesuaian isyarat analog yang cekap. Kesilapan yang paling biasa adalah berkaitan dengan masalah aliasing.

Menurut teorem Nyquist, kadar pensampelan ADC perlu berada di 2 kali lebih tinggi daripada frekuensi tertinggi isyarat masukan. Mana-mana isyarat tidak sesuai kriteria ini alias menjadi domain kekerapan utama dan topeng yang berguna sebagai bunyi tambahan:

Untuk mengelakkan masalah ini, penapis rendah pass analog digunakan sebelum ADC. Jurutera-jurutera perkakasan yang sangat kerap menganggap bahawa litar RC mudah cukup untuk tujuan itu. Tetapi ada perbezaan besar dalam tindak balas kekerapan antara penapis pasir rendah sempurna dan yang sebenar:

Merangkumi sifat frekuensi penapis analog yang ideal (kiri) dan nyata (kiri)

Pastikan Inti-Aliasing LPF memenuhi keperluan penindasan pada frekuensi Nyquist (Untuk maklumat tambahan, saya cadangkan buku ini):

  • 50dB untuk 8-bit ADC
  • 62dB untuk 10-bit ADC
  • 74dB untuk 12-bit ADC
  • 98dB untuk 16-bit ADC

2. Gunakan perkakasan yang sama untuk latihan dan ramalan

Peranti yang berbeza menentukan keadaan rakaman isyarat yang berbeza, seperti gangguan elektronik yang tidak linear, kepungan berlainan, kedudukan sensor yang berbeza, dan sebagainya.

Memandangkan keadaan yang berbeza menentukan isyarat berbeza, saya akan mengesyorkan untuk menggunakan perkakasan yang sama untuk model latihan dan membuat ramalan. Ia boleh menjadi punca berat sebelah tambahan pada set latihan.

Sekiranya tiada pilihan, kemungkinan untuk mencuba pre-distortion set latihan, tetapi ia memerlukan kepakaran tambahan dalam domain perkakasan dan bunyi.

3. Tequem nyquist untuk mempercepatkan latihan

Seperti yang diterangkan di atas, teorem Nyquist menentukan kadar sampel minimum ADC untuk menyimpan 100% maklumat isyarat analog selepas menukar. Maksudnya, jika kekerapan maksimum isyarat lebih rendah daripada Fs / 2, ia mempunyai redundansi, yang boleh digunakan untuk mempercepatkan latihan Rangkaian Deep.

Mari kita pertimbangkan satu contoh.

Terdapat isyarat ECG dengan kadar persampelan 125 Hz yang disediakan oleh pangkalan data Physionet (30 Hz penapis telah digunakan):

Petua untuk preprocessing ECG: Isyarat ECG memperuntukkan 0-100Hz, tetapi penapis pasir rendah 30Hz boleh digunakan. Ia membuat gelombang P dan T tidak disentuh, tetapi ia mengurangkan amplitud puncak R sebanyak 20-30%. Ia tidak penting untuk mengesan apa-apa keabnormalan dan pengiraan kadar denyutan jantung.

Ketumpatan Spektrum Kuasa dari isyarat seperti:

Seperti yang ditunjukkan di atas, bahagian utama tenaga isyarat tertumpu di antara 0-30Hz. Mari kita putuskannya ke dalam 80Hz dan bandingkan dengan isyarat asal:

Demonstrasi kesan penipisan: isyarat dengan kadar pensampelan 80Hz (atas) dan 125Hz (lebih rendah)

Bentuk asal disimpan, tetapi panjang keseluruhan isyarat dikurangkan sebanyak 35%, dari 92 hingga 59 sampel. Ia sama dengan percepatan latihan 35% tanpa ketepatan ketepatan.

Demonstrasi kecekapan pendekatan itu ditunjukkan dalam projek Github saya.

Nota penting: pastikan penumpuan anda tidak hilang sebarang butiran tambahan yang boleh digunakan untuk pengiktirafan. Percubaan adalah satu-satunya cara untuk membuktikan. Tetapi secara praktikal, latihan dua model yang disusun (CNN + LSTM) pada isyarat susulan biasanya lebih cepat daripada melatih satu model dengan kadar pensampelan asal tanpa kehilangan prestasi.

4. Memahami keperluan untuk sistem

Sebelum mencuba algoritma penapisan yang lebih kompleks, seperti Wavelette atau mengadopsi, saya akan mengesyorkan memahami ciri-ciri yang diperlukan untuk pengiktirafan.

Contohnya.

Mari kita pertimbangkan tugas untuk model Deep Learning adalah pengesanan arrhythmia semasa berjalan. Biasanya, data berjalan ECG mengandungi bunyi frekuensi rendah:

Sementara itu, isyarat ECG yang jelas kelihatan seperti ini:

Gelombang P dan T bertopeng dan ia adalah tugas yang agak tidak penting untuk mengeluarkannya. Sebelum cuba mengembangkan algoritma kompleks, mari kita lihat, apa sebenarnya arrhythmia adalah:

Untuk pengesanan arrhythmia, pengiraan denyutan hanya cukup untuk membina pengesan yang cekap, tetapi jelas, pengembalian baseline frekuensi rendah memasukkan pelbagai tambahan dengan pelanggaran stesen.

Bahagian ECG yang berlainan boleh memperuntukkan domain spektrum berbeza:

Ringkasnya, penapis Bandpass 5-15Hz mudah menyelesaikan masalah pengeluaran R-puncak. Dengan menggunakan penapis itu, gelombang P dan T ditindas (dan kelainan yang berkaitan dengannya tidak tersedia untuk pengiktirafan), tetapi keperluan untuk sistem dipenuhi.

Peraturan utama: sebagai lebih banyak algoritma adalah kompleks, semakin kurang ia kuat dan memerlukan lebih banyak sumber untuk melaksanakan (baik waktu dan wang). Penapisan digital paling mudah perlu menjadi perkara pertama yang perlu anda cuba.

5. Gunakan prinsip MiniMax dalam membangun saluran paip

Prinsip MiniMax adalah strategi hebat dari teori permainan.

Masalah utama dengan biosignal adalah perubahan kualiti isyarat dari masa ke masa:

  • Kes 1. Kualiti tinggi semasa aktiviti rendah subjek:
  • Kes 2. Kualiti buruk dalam data semasa bergerak sengit. P dan T bertopeng dan tidak ada cara untuk mengeluarkannya dari bunyi dengan sistem 1 saluran:

Untuk kes pertama P, QRS, T dapat dikesan, ini bermakna kebanyakan corak ECG yang tidak normal (serangan jantung, fibrilasi atrium, dll) boleh diiktiraf.

Bagi yang kedua, hanya beberapa yang tidak normal yang berkaitan dengan QRS (arrhythmia, dll.) Boleh diiktiraf.

Seperti yang ditunjukkan di atas, cara terbaik untuk mengekstrak QRS adalah dengan menggunakan penapis band 5-15Hz, sementara P dan T akan ditindas.

Untuk kes 2, ia tidak akan kritikal kerana P dan T dipersenjatai oleh bunyi bising, tetapi ia mengehadkan jumlah kemungkinan patologi yang dikesan sementara data berkualiti tinggi pada input.

Cara terbaik untuk mengelakkan masalah ini adalah dengan menggunakan penapis penyesuaian, yang mengubah tindak balas impuls terhadap persekitaran yang berubah:

Idea ini mudah:

  1. Buat pengesan kualiti data (pengesan linear / CNN);
  2. Tentukan set penapis;
  3. Buat peraturan mengubah tindak balas impuls bergantung kepada kualiti isyarat masukan.

6. Cara pintar menggunakan penapis Laluan Tinggi

Biasanya, Penapisan tinggi pas diperlukan untuk berurusan dengan pelayaran dasar:

EEG dengan bunyi baseline

Pendekatan yang jelas difikirkan menggunakan penapis lulus tinggi. Kekangan utama untuk itu adalah frekuensi potong yang sangat rendah (0.05Hz) dan penindasan stopband tinggi (> 30dB). Untuk memenuhi keperluan, penapis mesti mempunyai pesanan yang tinggi, ini bermakna kelewatan yang lama, yang mungkin tidak sesuai untuk aplikasi masa nyata.

Cara alternatif:

  • Untuk memecahkan isyarat masukan;
  • Ekstrak bunyi baseline dengan menggunakan penapis lulus rendah dengan frekuensi potong 0,05 Hz;
  • Sambungkan isyarat;
  • Kurangkan asas dari isyarat asal

Contoh kod (Matlab) boleh didapati di repositori GitHub ini.

7. percubaan berulang

Seperti mana-mana masalah Sains Data, klasifikasi biosignals adalah proses eksperimen berulang, kerana pendekatan penapisan yang berbeza mungkin sesuai untuk aplikasi yang berbeza.

Saya telah meringkaskan senarai penapisan teknik, dari yang paling dipercayai kepada yang paling teruk.

NOTA: Ia hanya pendapat peribadi saya, ia tidak boleh bertepatan dengan anda.

  • Penapisan digital (FIR, IIR). FIR disyorkan kerana ketiadaan kelewatan kumpulan kelewatan. Ia mempunyai prestasi yang sederhana, ideal untuk keadaan yang tidak spesifik, sangat mudah untuk dilaksanakan dan 100% kuat.
  • Penapisan Wavelet. Prestasi yang kuat, tetapi realisasi mungkin kompleks dari segi pemilihan parameter.
  • Penapisan penyesuaian. Kaedah ini menunjukkan prestasi yang lebih buruk daripada penapisan Wavelet, tetapi lebih mudah untuk dilaksanakan dengan ketangkasan dan prestasi yang baik.
  • Analisis Komponen Bebas (ICA) / Pemisahan Sumber Blind (BSS). Pelaksanaan algoritma ICA Cepat dalam bahasa pengaturcaraan yang paling popular boleh didapati di sini. Saya akan mengesyorkan untuk mencuba yang terakhir, kerana:
  1. Ia berfungsi dengan konfigurasi berbilang saluran sahaja;
  2. Saya dapati keteguhan pendekatan itu sangat miskin kerana penumpuan tidak terjamin;
  3. Ia memerlukan sumber pengiraan yang agak banyak, mungkin tidak sesuai untuk aplikasi masa nyata.

___________________________________________________________________

Menemukan kertas yang berguna? Tolong, tinggalkan maklum balas anda mengenai artikel dengan pautan ini

___________________________________________________________________

Dmitrii Shubin, jurutera R & D, Alat perubatan

Toronto, ON, Kanada

Maklumat perhubungan:

E-mel: shubin.dmitrii.n@gmail.com

LinkedIn, GitHub