156
8/9/2019 Elektronika_2010-03.pdf http://slidepdf.com/reader/full/elektronika2010-03pdf 1/156

Elektronika_2010-03.pdf

Embed Size (px)

Citation preview

Page 1: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 1/156

Page 2: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 2/156

Page 3: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 3/156

ELEKTRONIKA 3/2010 1

SIGMA - NOTSpó łka z o.o.00-950 Warszawa

skrytka pocztowa 1004ul. Ratuszowa 11

tel.: (0-22) 818 09 18, 818 98 32fax: (022) 619 21 87

Internethttp://www.sigma-not.pl

Prenumeratae-mail: [email protected]

Informacjee-mail: [email protected]

konstrukcje technologie zastosowania

MIESIECZNIK NAUKOWO-TECHNICZNY

MATERIAŁY • KONSTRUKCJE • UKŁADY

• SYSTEMY • MIKROELEKTRONIKA

• OPTOELEKTRONIKA • FOTONIKA

• ELEKTRONIKA MIKROFALOWA

• MECHATRONIKA

• ENERGOELEKTRONIKA • INFORMATYKA

rok LI nr 3/2010

„Elektronika” jest notowanaw międzynarodowej bazie IEEInspec

Publikowane artyku ły naukowe by łyrecenzowane przez samodzielnychpracowników nauki

Redakcja nie ponosi odpowiedzial-no ś ci za tre ść og łosze ń . Zastrzegasobie prawo do skracania i adiustacjinades łanych materia łów.

Indeks 35722Nak ład do 2000 egz.

Sk ład i druk: Drukarnia SIGMA-NOT Sp. z o.o.

Czasopismo dotowane przez Ministerstwo Naukii Szkolnictwa Wyższego. Za opublikowane w nim artyku ły

MNiSzW przyznaje 6 punktów.

ZESPÓŁ REDAKCYJNY

prof. dr hab. in ż. Jerzy Klamka – redaktor naczelnyBożena Lacho wicz – sekretarz redakcji

Stali wspó łpracownicy: mgr in ż . Wies ław Jab łoński,mgr in ż. Krzysztof Kowalski, mgr in ż. Cezary Rudnicki, dr Juliusz Szcz ęsny

Adres redakcji: ul. Chmielna 6 m.6, 00-020 Warszawa,tel./fax (022) 827 38 79; tel.: 826 65 64,e-mail: [email protected] , www.elektronika.orf.plZamówienia na reklam ę przyjmuje redakcja lub Dzia ł Reklamyi Marketingu, ul. Mazowiecka 12, 00-950 Warszawa, skr. 1004,tel./fax (022) 827 43 66, 826 80 16, e-mail: [email protected]ż: ul. Ku Wi ś le 7, 00-716 Warszawa, tel. (022) 840 35 89;tel./fax: (022) 840 59 49, (022) 891 13 74

RADA PROGRAMOWAprof. dr hab. in ż. Władys ław Torbicz (PAN) – przewodnicz ą cyprof. dr hab. in ż. Leonard Bolc, prof. dr hab. Zdzis ław Drozd, prof. drhab. in ż. Jerzy Fr ą czek, dr hab in ż. Krzysztof Górecki, dr in ż. Józef Gro-mek, mgr in ż. Jan Grzybowski, prof. dr hab. Ryszard Jachowicz, prof.dr hab. W łodzimierz Janke, prof. dr hab. W łodzimierz Kalita, in ż. StefanKami ński, prof. dr hab. in ż. Marian P. Ka źmierkowski, dr in ż. WojciechKoca ńda, prof. dr hab. Bogdan Kosmowski, mgr in ż. Zbigniew Lange,dr in ż . Zygmunt Łuczy ński, prof. dr hab. in ż . Józef Modelski, prof. drhab. Tadeusz Morawski, prof. dr hab. Bohdan Mroziewicz, prof. dr hab.

Andrzej Napieralski, prof. dr hab. Tadeusz Pa łko, prof. dr hab. in ż . Ma-rian Pasko, dr hab. in ż. Ryszard Romaniuk, dr hab. in ż. Grzegorz Ró-żański, prof. dr hab. in ż. Edward S ę dek, prof. dr hab. Ludwik Spiralski,prof. dr hab. in ż. Zdzis ław Trzaska, mgr in ż. Józef Wiechowski, prof.dr hab. in ż. Marian Wnuk, prof. dr hab. in ż. Janusz Zar ę bski

SPIS TRE Ś CI ● CONTENTS

Koncepcja multimedialnej bazy danych do rejestracji i prze-szukiwania rozmów na telefony alarmowe (Multimedia data-base system concept for storing and searching emergency te-lephone conversations) – J. Balcerek, Sz. Drgas, A. D ą browski,

A. Konieczka. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10Implementation of synchronous sample rate converter using

modular audio processing system (Implementacja synchro-nicznego konwertera cz ę stotliwo ś ci próbkowania z wykorzy-staniem modularnego systemu przetwarzania sygna łów fonicz-nych) – P. Bobi ński, B. Bielawski, P. Nykiel . . . . . . . . . . . . . . . . 14

In uence of accelerometer signal pre-processing and clas-si cation method on human activity recognition (Wp ływprzetwarzania wst ę pnego i wyboru metody klasy kacji na sku-teczno ść rozpoznawania aktywno ś ci ruchowych) – A. Kupryja-now, K. Kaszuba, A. Czy żewski. . . . . . . . . . . . . . . . . . . . . . . . . 18

Real-time speech stretching for supporting hearing impairedschoolchildren (Spowalnianie mowy w czasie rzeczywistymw celu poprawy rozumienia mowy przez dzieci szkolne) – A. Ku-pryjanow, A. Czy żewski. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

A exible DSP/FPGA-based hardware platform for powerelectronics (Elastyczna platforma sprz ę towa do aplikacji ener-goelektronicznych z procesorami DSP i uk ładami programo-walnymi FPGA) – L. D ę bowski . . . . . . . . . . . . . . . . . . . . . . . . . . 28

The impact of digital lter parameters on the results of nonli-near distortion measurements in loudspeakers – simulationprocess (Wp ływ parametrów ltrów cyfrowych na wyniki pomia-rów zniekszta łce ń nieliniowych g łoś ników – symulacja) – A. Do-brucki, R. Siczek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

A discrete-time sine wave delay estimator (A discre-te-time sine wave delay estimator ) – E. Hermanowicz,

A. Rojewski. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38Powiększanie zakresu dynamicznego zdj ęć zapisanych w for-

macie RAW (Increasing of dynamic range of photographs registe-red in RAW format) – A. Konieczka, J. Balcerek, A. D ą browski . . . 42

Discrete trigonometric transform (DTT) lters (Filtry realizo-wane za pomoc ą dyskretnych transformacji trygonometrycz-nych (DTT)) – P. Korohoda, A. D ą browski . . . . . . . . . . . . . . . . . 45

Gesture-based computer control system (System sterowa-nia komputerem za pomoc ą gestów) – M. Lech, B. Kostek,

A. Czy żewski, P. Odya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Selection of tracking model parameters in embedded video

system (Dobór parametrów modelu ś ledzenia we wbudowa-nym systemie wideo) – T. Marciniak, D. Jackowski, P. Paw łow-ski, A. D ą browski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Time-of- ight versus stereovision in depth sensing applica-tions: experimental study (Porównanie metod czasu przelotuoraz stereowizji do zastosowa ń w systemach rekonstrukcji g łę -bi sceny trójwymiarowej) – M. Mora ński, A. Materka . . . . . . . . . 57

Drabinkowa struktura uk ładu mno żenia kwaternionów: analizai redukcja zakresu dynamicznego (Ladder structure of qua-ternion multiplier: analysis and reduction of dynamic range)

– M. Par eniuk, A. Petrovsky . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Operational ampli er for switched capacitor systems reali-

zed in various CMOS technologies (Wzmacniacz operacyjnyprzeznaczony do systemów z prze łą czanymi kondensatoramiwykonanych w ró żnych technologiach CMOS) – R. D ługosz, P.Paw łowski, A. D ą browski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

“Elektronika” jest wydawanaprzy współpracy Komitetu Elektronikii Telekomunikacji Polskiej Akademii Nauk

Redakcja współpracujez Polską Sekcją IEEE

IEEE

WYDAWNICTWOCZASOPISM I KSIĄŻEK

TECHNICZNYCH

Page 4: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 4/156

ELEKTRONIKA 3/20102

Streszczenia artyku łów ● Summaries of the articles

BALCEREK J., DRGAS SZ., DĄ BROWSKI A., KONIECZKA A.:Multimedia database system concept for storing and searchingemergency telephone conversationsElektronika (LI), no 3/2010, p. 10In this paper an experimental multimedia database system for storingand searching speakers performing emergency telephone conversa-tions is presented. In this paper we assume that this database is cre-ated exclusively with multilevel (sound and linguistic) data extracteddirectly from the recorded emergency telephone calls. The presentedsystem enables conducting speaker recognition experiments. Sour-ces of data, metadata generation, architecture description, searchingfor results, and database implementation are comprised.Keywords: emergency telephone conversations, multimedia databa-se, metadata, information sources, searching for results

BALCEREK J., DRGAS SZ., DĄ BROWSKI A., KONIECZKA A.:Koncepcja multimedialnej bazy danych do rejestracji i przeszu-kiwania rozmów na telefony alarmoweElektronika (LI), nr 3/2010, s. 10Przedmiotem niniejszego artyku łu jest prezentacja eksperymentalnejmultimedialnej bazy danych s łużą cej do rejestracji i przechowywaniaistotnych informacji o sytuacjach zagro że ń na podstawie rozmów natelefony alarmowe. Baza zawiera dane wielopoziomowe (d źwię kowei lingwistyczne) pochodz ą ce z nagra ń rozmów na telefony alarmowe.Prezentowany system umo ż liwia przeprowadzanie eksperymentówdotycz ą cych rozpoznawania mówcy. W opracowaniu przedstawionoźród ła danych, generacj ę metadanych, architektur ę , metody przeszu-kiwania bazy i implementacj ę systemu.Słowa kluczowe: rozmowy na telefony alarmowe, multimedialnabaza danych, metadane, źród ła informacji, wyszukiwanie danych

BOBIŃSKI P., BIELAWSKI B., NYKIEL P.: Implementation of syn-chronous sample rate converter using modular audio proces-sing systemElektronika (LI), no 3/2010, p. 14The paper describes a simple yet powerful audio processing libra-ry for personal computers and demonstrates how it can be used tocreate a synchronous sample rate converter. In the rst part Modular

Audio Processing System (MAPS) is presented. The two unique fe-atures are integer-only calculations assuring high processing qualityand modular design enabling rapid system development. The secondpart of the paper presents possible uses of MAPS and a representati-ve implementation of synchronous sample rate converter utilizing thelibrary and the Qt Toolkit for GUI creation. The software details as wellas the general system architecture are presented. Test results con rmthe usefullness of presented solution.

Keywords: digital signal processing, audio processing, synchronoussample rate converter

BOBIŃSKI P., BIELAWSKI B., NYKIEL P.: Implementacja synchro-nicznego konwertera cz ęstotliwo ści próbkowania z wykorzysta-niem modularnego systemu przetwarzania sygna łów fonicznychElektronika (LI), nr 3/2010, s. 14W artykule opisano prost ą , ale wydajn ą bibliotek ę , s łużą cą do prze-twarzania sygna łów fonicznych na komputerach klasy PC. Jakoprzyk ład wykorzystania zrealizowano synchroniczny konwerter cz ę -stotliwo ś ci próbkowania. W cz ęś ci pierwszej zaprezentowano systemMAPS ( Modular Audio Processing System ), którego unikalne cechy towykorzystanie oblicze ń wyłą cznie na liczbach sta łoprzecinkowych, cozapewnia wysok ą jako ść przetwarzania danych oraz modu łowa bu-dowa pozwalaj ą ca na szybk ą implementacj ę wybranych algorytmów.W cz ęś ci drugiej pokazano przyk ładow ą implementacj ą synchro-nicznego konwertera cz ę stotliwo ś ci próbkowania z wykorzystaniemzbudowanej biblioteki oraz pakietu QT Toolkit wspomagaj ą cego two-rzenie gra cznego interfejsu u żytkownika. W pracy zaprezentowanozarówno szczegó ły implementacji jak i ogóln ą struktur ę systemu. Wy-niki testów potwierdzi ły u żyteczno ść prezentowanego rozwi ą zania.Słowa kluczowe: cyfrowe przetwarzanie sygna łów, przetwarzanie syg-na łów fonicznych, synchroniczny konwerter cz ę stotliwo ś ci próbkowania

System CCTV do automatycznego ś ledzenia obiektów w cza-sie rzeczywistym (Real-time CCTV system for automaticobject tracking) – P. Paw łowski, K. Borowczyk, T. Marciniak,

A. D ą browski. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71Effectiveness of the frequency offset computation procedure

(Efektywno ść procedury wyznaczania poprawki k ą ta fazowe-go) – Z . Piotrowski. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Level set based automatic segmentation of ultrasound echo-cardiographic images (Automatyczna segmentacja echokar-diogramów wykorzystuj ą ca metod ę zbiorów poziomicowych)

– A. Skalski, T.P. Zieli ński, P. Turcza. . . . . . . . . . . . . . . . . . . . . . 80A digital click modulator for a class-D audio power ampli er

(Cyfrowy modulator typu click modulation dla elektroakustycz-nego wzmacniacza mocy klasy D) – K.P. Soza ński . . . . . . . . . . 84

The architecture of image analysis system for implementingparallel digital image processor (Architektura systemu ana-lizy obrazów implementujacego równoleg ły cyfrowy procesorobrazowy) – P. Brylski, M. Strzelecki . . . . . . . . . . . . . . . . . . . . . 90

Wpływ segmentacji sygna łu w procesie detekcji kodowaniaGSM (In uence of signal segmentation in GSM coding detec-tion) – R. Weychan, T. Marciniak, A. D ą browski . . . . . . . . . . . . . 94

Analog signal processing suited for neural-network hardwareimplementation (Analogowe przetwarzanie sygna łów odpowied-

nie do sprz ę towej implementacji sieci neuronowych) – R. Wojtyna 97OFDM VS Wavelet-OFDM and Circular Wavelet-OFDM in high

speed communication over power lines (Porównanie efek-tywno ś ci zastosowania modulacji OFDM, Wavelet-OFDM i Cir-cular-Wavelet-OFDM do transmisji szerokopasmowej w instala-cjach elektrycznych) – Ł. Zbydniewski, T.P. Zieli ński . . . . . . . . . 102

Automatic estimation of the intima-media thickness of thecommon carotid artery (Automatyczna estymacja grubo-ś ci b łony wewn ę trznej i ś rodkowej t ę tnicy szyjnej) – P. Turcza,T.P. Zieli ński, A. Lay-Ekuakille . . . . . . . . . . . . . . . . . . . . . . . . . . 109

TECHNIKA MIKROFALOWA I RADIOLOKACJA: Uproszczonyanalityczny model rozpraszania mocy w linii opó źniają -cej lampy fali bie żą cej (Simplifed analytical model of powerdissipation in delay line of traveling wave tube) – W. Wiejak,

A. Wymys łowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

TECHNIKA SENSOROWA: Miniaturyzacja cytometru przep ły-wowego (Miniaturization of ow cytometer) – R. Szczypi ński,E. Jab łońska-Kugler, A. Baraniecka, D.G. Pijanowska. . . . . . . 120

TECHNIKI INFORMATYCZNE : O protokóle Ekerta w kryp-togra i kwantowej (About Ekert (EPR) protocol in quantumcryptography) – R. Czajkowski, W. Nowakowski . . . . . . . . . . . 126

Modele e-learningu w reklamie telewizyjnej …? (Models of thee-learning in a TV commercial…?) – J. Brzostek-Paw łowska . . . 128

Corrosion reliability of microelectronic devices. Part I: Fun-damentals (Odporno ść korozyjna urz ą dze ń mikroelektronicz-nych. Cz ęść I: Podstawy) – Z. Trzaska. . . . . . . . . . . . . . . . . . . 130

Cyfrowy odbiornik z uk ładem FPGA do spektrometru EPR (Digital receiver for EPR spectrometer using FPGA structu-re) – J. Duchiewicz, A.L. Dobrucki, A. Francik, T. Duchiewicz,

A. Sadowski, B. Id źkowski, A. Kutynia . . . . . . . . . . . . . . . . . . . 139Heterostruktury AlGaN/AlN/GaN na pod łożach 4H-SiC uzy-

skane metod ą LP MOVPE do zastosowa ń w technologiitranzystorów HEMT (AlGaN/AlN/GaN heterostructures grownon 4H-SiC substrates by LP MOVPE for HEMT technology ap-plications) – P. Caban, W. Strupi ński, J. Szmidt. . . . . . . . . . . . 145

Page 5: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 5/156

ELEKTRONIKA 3/2010 3

Streszczenia artyku łów ● Summaries of the articles

KUPRYJANOW A., KASZUBA K., CZYŻEWSKI A.: Wpływ przetwa-rzania wst ępnego i wyboru metody klasy kacji na skuteczno ść rozpoznawania aktywno ści ruchowychElektronika (LI), nr 3/2010, s. 18W artykule przedstawiono wp ływ przetwarzania wst ę pnego sygna łuprzyspieszenia na skuteczno ść rozpoznawania aktywno ś ci rucho-wych. Przeanalizowano zale żno ść ltracji sygna łów oraz ilo ś ci za-

stosowanych czujników na skuteczno ść klasy

kacji. W badaniachwykorzystano cztery ró żne klasy katory: maszyn ę wektorów wspar-cia, drzewa decyzyjne, sztuczne sieci neuronowe oraz klasy katornajbli ższego s ą siada.Słowa kluczowe: czujniki przyspieszenia, rozpoznawanie aktywno-ś ci, klasy kacja ruchu, algorytm najbli ższego s ą siada, sie ć neurono-wa, maszyna wektorów wsparcia, drzewa decyzyjne

KUPRYJANOW A., KASZUBA K., CZYŻEWSKI A.: In uence of ac-celerometer signal pre-processing and classi cation method onhuman activity recognitionElektronika (LI), no 3/2010, p. 18

A study of data pre-processing in uence on accelerometer-based hu-man activity recognition algorithms is presented. The frequency bandused to lter-out the accelerometer signals and the number of ac-

celerometers involved were considered in terms of their in

uence onthe recognition accuracy. In the tests four methods of classi cationwere used: support vector machine, decision trees, neural network,k-nearest neighbor.Keywords: accelerometer, human activity recognition, human activ-ity classi cation, k-nearest neighbor, neural network, support vectormachine, decision tree

KUPRYJANOW A., CZYŻEWSKI A.: Spowalnianie mowy w cza-sie rzeczywistym w celu poprawy rozumienia mowy przez dzieciszkolneElektronika (LI), nr 3/2010, s. 24W artykule przedstawiono przegl ą d algorytmów s łużą cych do mody-kacji czasu trwania mowy oraz analiz ę mo ż liwość ich zastosowania

do celu wspomagania procesu rozumienia mowy u dzieci w szkole.Zbadano nast ę pują ce algorytmy: overlap and add, dwie odmiany al-gorytmu synchronous overlap and add oraz wokoder fazowy. W cz ę -ś ci eksperymentalnej zbadano skuteczno ść dzia łania algorytmóworaz ich z łożono ść obliczeniow ą .Słowa kluczowe : spowalnianie mowy, zaburzenia s łuchu, wokoderfazowy

KUPRYJANOW A., CZYŻEWSKI A.: Real-time speech stretchingfor supporting hearing impaired schoolchildrenElektronika (LI), no 3/2010, p. 24

A study of time scale modi cation algorithms applied to support he-aring impaired schoolchildren is presented. Variety of algorithms areconsidered, namely: overlap-and-add, two variations of synchronous

overlap- and-add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.Keywords: real-time speech stretching, hearing impaired, overlap-and-add, synchronous overlap and add, phase vocoder

DĘBOWSKI L.: Elastyczna platforma sprz ętowa do aplikacjienergoelektronicznych z procesorami DSP i uk ładami programo-walnymi FPGAElektronika (LI), nr 3/2010, s. 28Jednym z najwa żniejszych elementów wchodz ą cych w sk ład wspó ł-czesnych przekszta łtników energoelektronicznych jest system ste-rowania. Musi on spe łnia ć wymagania sprz ę towe stawiane przezokre ś lon ą topologi ę przekszta łtnika oraz posiada ć moc obliczeniow ą dostosowan ą do implementowanego algorytmu sterowania. Procesrozwojowy zaawansowanych systemów sterowania dla energo-elektroniki jest bardzo czasoch łonny i musi nieustannie nad ąż a ć zanowymi rozwi ą zaniami technologicznymi uk ładów mikroelektronicz-nych. W referacie zaprezentowano elastyczn ą architektur ę systemusterowania przeznaczonego do szybkiego prototypowania i aplikacjidocelowych z zakresu przekszta łcania energii elektrycznej i technikinap ę dowej. W systemie wykorzystano nowoczesne uk łady mikroelek-troniczne przeznaczone do cyfrowego przetwarzania sygna łów: pro-cesory sygna łowe (DSP) i z łożone uk łady programowalne (FPGA).Podano kilka przyk ładów zastosowa ń obrazuj ą cych elastyczno ść i inne w ła ś ciwo ś ci nowej architektury sprz ę towej.Słowa kluczowe: systemy sterowania, przekszta łtniki energoelektro-niczne, cyfrowe przetwarzanie sygna łów

DĘBOWSKI L.: A exible DSP/FPGA-based hardware platformfor power electronicsElektronika (LI), no 3/2010, p. 28One of the major part of any power converter is a control system. Itmust ful l both requirements of power converter hardware topologyand computing power necessary for control algorithm implementation.The development process of advanced control systems for powerelectronics is very time consuming and it must continuously follow onthe technology progress. A exible architecture of digital control sy-stem is proposed for rapid prototyping and target applications supportin power conversion and motion control areas. The system is basedon advanced integrated circuits dedicated for signal processing: digi-tal signal processors (DSP) and programmable logic devices (FPGA).Some application examples explain the exibility and other advanta-ges of the new architecture.Keywords: control systems, power converters, digital signal proces-sing

DOBRUCKI A., SICZEK R.: Wpływ parametrów ltrów cyfrowychna wyniki pomiarów zniekszta łceń nieliniowych g łośników – sy-mulacjaElektronika (LI), nr 3/2010, s. 34W artykule przedstawiono wp ływ zmiany parametrów ltrów cyfro-wych na wyniki pomiarów zniekszta łce ń nieliniowych w g łoś nikach.Metod ą pomiarow ą jest metoda szumu szerokopasmowego. Opisanosposób wykonania pomiarów zniekszta łce ń nieliniowych g łoś nikówz wykorzystaniem ltrów cyfrowych przy pobudzeniu uk ładu szumembia łym lub ró żowymSłowa kluczowe: ltr cyfrowy, zniekszta łcenia nieliniowe, szum sze-rokopasmowy, g łoś nik

DOBRUCKI A., SICZEK R.: The impact of digital lter parame-ters on the results of nonlinear distortion measurements in loud-speakers – simulation processElektronika (LI), no 3/2010, p. 34In this article the impact of changes of digital lter parameters onnonlinear distortion measurements in loudspeakers is presented. Formeasurements the measurement method of broad-band noise wasused. The procedure of measurement of nonlinear distortion in loud-speakers with the use of digital lters with white or pink noise excita-tion is described.Keywords: digital lter, nonlinear distortion, broadband noise, loud-speaker

Page 6: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 6/156

ELEKTRONIKA 3/20104

Streszczenia artyku łów ● Summaries of the articles

HERMANOWICZ E., ROJEWSKI A.: Dyskretno-czasowy estyma-tor opó źnienia sinusoidyElektronika (LI), nr 3/2010, s. 38W artykule przedstawiono nowe rozwi ą zanie dyskretno-czasowegoestymatora opó źnienia mi ę dzypróbkowego sinusoidy, dzia łają cegoz otwart ą p ę tlą sprz ęż enia zwrotnego. Proponowane rozwi ą zaniewykorzystuje koncepcj ę przekszta łcenia Hilberta sygna łu odniesie-

nia w celu estymacji ró żnicy faz wzgl ę dem zaszumionego sygna łuodebranego o nieznanej fazie pocz ą tkowej i nieznanym opó źnieniu.Estymator ten jest przeznaczony do pracy z sygna łem o znormalizo-wanej cz ę stotliwo ś ci ś rodkowej równej jednej czwartej cz ę stotliwo ś cipróbkowania – typowej dla zastosowa ń telekomunikacyjnych, ze sto-sunkiem mocy sygna łu do szumu (SNR) wi ę kszym od 15 dB. Pozwalaon na niewielkie odstrojenie sygna łu odebranego od tej cz ę stotliwo-ś ci. Zamieszczono analiz ę charakterystyk i w ła ś ciwo ś ci proponowa-nego estymatora opó źnienia i zilustrowano wynikami eksperymentóww obecno ś ci szumu.Słowa kluczowe: estymacja opó źnienia, transformacja Hilberta, sy-stem dyskretno-czasowy

HERMANOWICZ E., ROJEWSKI A.: A discrete-time sine wave de-lay estimator Elektronika (LI), no 3/2010, p. 38In the paper a novel open-loop solution of a sine wave sub sampletime delay estimator operating in the discrete-time domain is pre-sented. The proposed solution is based on a concept of Hilbert trans-forming the reference signal in order to estimate the phase difference

relative to the received noised signal whose initial phase and delayare unknown. The engineered estimator works well around the nor-malized centre frequency equal to 0.25 of sampling rate typical ofsome communication applications, with SNR (signal to noise ratio)higher than 15 dB. It allows for some slight detuning of the receivedsignal from the above mentioned centre frequency. The performanceof the time delay estimator is analysed and illustrated by the results ofits operation in presence of noise.Keywords: delay estimation, Hilbert transformation, discrete-timesystem

KONIECZKA A., BALCEREK J., DĄ BROWSKI A.: Powiększaniezakresu dynamicznego zdj ęć zapisanych w formacie RAW

Elektronika (LI), nr 3/2010, s. 42W artykule zaproponowano metod ę powi ę kszania zakresu dyna-micznego zdj ęć cyfrowych zapisanych pierwotnie w formacie RAW.Przedstawiono i przeanalizowano w ła ś ciwo ś ci opracowanego algo-rytmu. Zaprezentowano przyk ładowe wyniki dla ró żnych parametrówprzetwarzania obrazu oraz wyniki porównania opracowanej metodyz prost ą metod ą obni żania kontrastu zdj ęć .Słowa kluczowe: HDR, DRI, fotogra a cyfrowa, przetwarzanie obra-zów

KONIECZKA A., BALCEREK J., DĄ BROWSKI A.: Increasing ofdynamic range of photographs registered in RAW format

Elektronika (LI), no 3/2010, p. 42In this paper a method for increasing the dynamic range of digitalpictures originally stored in RAW format, is suggested. Features of theprepared algorithm are presented and analyzed. Illustrative examplesfor various image processing parameters are shown together with theresults of comparison of the proposed method with the simple methodbased on the contrast reduction.Keywords: HDR, DRI, digital photography, image processing

KOROHODA P., DĄ BROWSKI A.: Filtry realizowane za pomocą dyskretnych transformacji trygonometrycznych (DTT)Elektronika (LI), nr 3/2010, s. 45W artykule zaproponowano nowy sposób ltracji sygna łów dyskretnych,

polegaj ą cy na zastosowaniu dyskretnych transformacji trygonome-trycznych (DTT). Pomys ł wynika z koncepcji uogólnionego splotu, uzu-pe łnionego o operacj ę wycinania elementów macierzy splotu oknemprostok ą tnym. Wyniki eksperymentów, przeprowadzone dla czterechpodstawowych typów ltrów: dolno-przepustowy, górno-przepustowy,pasmowo-przepustowy i pasmowo-zaporowy, zde niowanych w dzie-dzinach wszystkich 16. DTT, wskazuj ą , że, w porównaniu z odpowied-nio dostrojonymi w dziedzinie Fouriera (cz ę stotliwo ś ci) charakterystyka-mi ltrów o sko ńczonej odpowiedzi impulsowej (FIR), zaproponowaneuję cie mo że by ć uznane za prowadz ą ce do rozwi ą za ń alternatywnych,podobnych do klasycznej Fourierowskiej ltracji FIR. Ta obserwacja ot-wiera nowy kierunek interesuj ą cych zastosowa ń DTT.Słowa kluczowe: ltry sygna łów dyskretnych, ltry FIR, DFT, DTT,DCT, TST

KOROHODA P., DĄ BROWSKI A.: Discrete trigonometric trans-form (DTT) ltersElektronika (LI), no 3/2010, p. 45In the paper a novel approach to discrete signal ltering based on the

discrete trigonometric transforms (DTTs) is proposed. The concept isderived from the generalized convolution, modi ed by the rectangularwindowing applied to the convolution matrix. The experimental resultsobtained for the four basic lter types: low-pass, high-pass, band-passand band-reject, de ned in domains of all 16 DTTs, as compared tothe relevantly adjusted nite impulse response (FIR) lter character-istics in the Fourier (frequency) domain, indicate that the proposedapproach may be treated as offering resembling alternatives to theclassical Fourier-based FIR ltering, This observation opens new di-rection of interesting DTTs applications.Keywords: discrete signal lters, FIR lters, DFT, DTT, DCT, TST

LECH M., KOSTEK B., CZYŻEWSKI A., ODYA P.: System sterowa-nia komputerem za pomoc ą gestówElektronika (LI), nr 3/2010, s. 49W artykule przedstawiono system sterowania komputerem za pomo-cą gestów r ą k. W pierwszej cz ęś ci dokonano przegl ą du wybranychmetod rozpoznawania gestów. Nast ę pnie zaprezentowano cz ęść sprz ę tow ą systemu oraz metodyk ę sterowania. Opisano równie ż ar-chitektur ę oprogramowania wraz z metodami i algorytmami zastoso-wanymi przy rozpoznawaniu gestów r ą k. W dalszej cz ęś ci pokazanozestaw prostych gestów oraz bazuj ą cych na nich gestów z łożonych,rozpoznawanych przez system.Słowa kluczowe: rozpoznawanie gestów, przetwarzanie obrazów,interakcja cz łowieka z komputerem

LECH M., KOSTEK B., CZYŻEWSKI A., ODYA P.: Gesture-basedcomputer control systemElektronika (LI), no 3/2010, p. 49In the paper a system for controlling computer applications by handgestures is presented. First, selected methods used for gesture re-cognition are described. The system hardware and a way of control-ling a computer by gestures are described. The architecture of thesoftware along with hand gesture recognition methods and algorithmsused are presented. Examples of basic and complex gestures recog-nized by the system are given.Keywords: gesture recognition, image processing, human computerinteraction

Page 7: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 7/156

ELEKTRONIKA 3/2010 5

Streszczenia artyku łów ● Summaries of the articles

MARCINIAK T., JACKOWSKI D., PAWŁOWSKI P., DĄ BROWSKIA.: Dobór parametrów modelu ś ledzenia we wbudowanym sy-stemie wideElektronika (LI), nr 3/2010, s. 53

Artyku ł prezentuje implementacj ę oraz analiz ę efektywno ś ci ś ledze-nia obiektów w sekwencjach wideo z zastosowaniem systemu wbu-dowanego. Algorytm ś ledzenia zosta ł zaprojektowany jako modelw ś rodowisku Matlab/Simulink. Po optymalizacji, budow ę modeludostosowano do wymaga ń systemu wbudowanego, sk ładaj ą cego si ę z modu łu eksperymentalnego DM6437 oraz wej ś ciowych oraz wyj-ś ciowych urz ą dze ń wideo. Podczas testów przeanalizowano wp ływdodatkowych przekszta łce ń obrazu na liczb ę przetwarzanych ramekw czasie sekundy.Słowa kluczowe: ś ledzenie obiektów, przetwarzanie sekwencji wi-deo, procesory sygna łowe, DM6437

MARCINIAK T., JACKOWSKI D., PAWŁOWSKI P., DĄ BROWSKIA.: Selection of tracking model parameters in embedded videosystemElektronika (LI), no 3/2010, p. 53This paper shows an implementation and effectiveness analysis ofobject tracking in video sequences using an embedded system. Thetracking algorithm was designed as a model in Matlab/Simulink envi-ronment. After optimizations this model was adapted to the embed-ded system, which consists of DM6437 Evaluation Module and inputand output video devices. During the tests an in uence of additionalimage operations on the number of the processed frames per secondwas analyzed.Keywords: object tracking, video sequence processing, signal pro-cessors, DM6437

MORAŃSKI M., MATERKA A.: Porównanie metod czasu przelotuoraz stereowizji do zastosowa ń w systemach rekonstrukcji g łębisceny trójwymiarowejElektronika (LI), nr 3/2010, s. 57W publikacji przedstawiony zosta ł krótki przegl ą d metod rekonstrukcjigłębi. Rekonstrukcja trzeciego wymiaru jest zagadnieniem skompliko-wanym ze wzgl ę du na implementacj ę sprz ę tow ą oraz z łożone algo-rytmy obliczenie. Artyku ł ma na celu ocen ę metod rekonstrukcji g łębii wybór najbardziej u żytecznej do budowy autonomicznego systemunawigacji osób niewidomych. Autorzy skupiaj ą si ę na dwóch techni-kach: stereowizji oraz czasu przelotu (TOF), opisuj ą c ich mo ż liwoś cii ograniczenia oraz prezentuj ą wst ę pne wyniki bada ń .Słowa kluczowe: czas przelotu, stereowizja, rekonstrukcja trzeciegowymiaru, widzenie komputerowe, analiza scen trójwymiarowych

MORAŃSKI M., MATERKA A.: Time-of- ight versus stereovisionin depth sensing applications: experimental studyElektronika (LI), no 3/2010, p. 57

A short survey of scene depth estimation methods is presented. 3Dreconstruction is a very complex problem and presents technical and

computing challenges. This assessment is made in order to decidewhich method or a hybrid of methods can be utilized to build a sys-tem prototype for guiding blind pedestrians with special focus for thetime-of- ight (TOF) and stereovision. Main restrictions are pointed outand measurements described. Results of preliminary experiments arealso presented.Keywords: time of ight, stereovision, depth recovery, computer vi-sion, 3D reconstruction

PARFIENIUK M., PETROVSKY A.: Drabinkowa struktura układumnożenia kwaternionów: analiza i redukcja zakresu dynamicznegoElektronika (LI), nr 3/2010, s. 61

Artyku ł dotyczy drabinkowej struktury uk ładu mno żenia kwaternionów,która stanowi czterowymiarowe rozszerzenie znanego schematu liftingdo realizacji mno żenia zespolonego (obrotu planarnego). Przedsta-wiono metod ę analizy zakresu dynamicznego i przekszta łcenia struk-turalne, które u łatwiaj ą implementacj ę algorytmu z u życiem arytmetykio sko ńczonej precyzji. W szczególno ś ci pokazano jak zast ą pić uk ładmno żą cy o zadanym wspó łczynniku wersj ą , w której ta liczba hiperze-spolona ma tak poprzestawiane cz ęś ci, że odpowiedni schemat oblicze-niowy charakteryzuje si ę zminimalizowanym zakresem dynamicznym,co upraszcza skalowanie w wypadku implementacji sta łoprzecinkowej.Słowa kluczowe : kwaternion, liczba hiperzespolona, uk ład mno żą cy,schemat lifting, struktura drabinkowa, implementacja sta łoprzecinko-wa, arytmetyka o sko ńczonej precyzji

PARFIENIUK M., PETROVSKY A.: Ladder structure of quaternionmultiplier: analysis and reduction of dynamic rangeElektronika (LI), no 3/2010, p. 61

A ladder structure of quaternion multiplier is considered, which isa four-dimensional extension of the known lifting scheme for com-puting complex multiplication (planar rotation). A method of dynamicrange analysis and structural transformations are presented whichfacilitate nite-precision implementation of the algorithm using nite-precision arithmetic. In particular, it is shown how to substitute themultiplier of a given coef cient with a version in which the hypercom-plex number has parts permuted in such a way that the correspondingcomputational scheme has minimized dynamic range, which simpli-es scaling in the case of xed-point implementation.Keywords : quaternion, hypercomplex number, multiplier, lifting sche-me, ladder structure, xed-point implementation, nite-precision, arit-hmetic

DŁUGOSZ R., PAWŁOWSKI P., DĄ BROWSKI A.: Wzmacniaczoperacyjny przeznaczony do systemów z prze łą czanymi konden-satorami wykonanych w ró żnych technologiach CMOSElektronika (LI), nr 3/2010, s. 67W artykule przedstawiono szczegó łową analiz ę dwustopniowegowzmacniacza operacyjnego, powszechnie u żywanego w ltrach o sko ń-czonej odpowiedzi impulsowej wykonanych w technice prze łą czanychkondensatorów. Dobór w ła ś ciwego do danego ltru wzmacniacza ope-racyjnego jest bardzo istotnym elementem projektu. Parametry wzmac-niacza po ś rednio wp ływają na osi ą gane parametry: szybko ść dzia łania,pobór mocy, powierzchni ę układu scalonego, a tak że selektywno ść ltru.W pracy porównano parametry wzmacniaczy wykonanych w technolo-giach CMOS AMS 0,8 μm, 0,35 μm, a tak że TSMC 0,18 μm. Zgodniez oczekiwaniami najlepsze osi ą gi uzyska ł wzmacniacz wykonany w pro-cesie 0,18 μm. Iloczyn szeroko ś ci pasma i wzmocnienia osi ą gnął war-tość 1,9 GHz, przy poborze mocy 600 μW i zasilaniu 1,8 V. Powierzchniapojedynczego wzmacniacza operacyjnego równa si ę 400 μm 2 i jest oko ło20-krotnie mniejsza ni ż w technologii 0,8 μm. Przeprowadzono równie ż analiz ę zmienno ś ci procesu produkcyjnego dla ró żnych temperatur, na-pięć zasilania i kilku modeli tranzystorów w procesie CMOS 0,18 μm.Słowa kluczowe: wzmacniacze operacyjne, ltry z prze łą czanymikondensatorami, technologia CMOS, analiza zmienno ś ci procesu

DŁUGOSZ R., PAWŁOWSKI P., DĄ BROWSKI A.: Operational am-pli er for switched capacitor systems realized in various CMOStechnologiesElektronika (LI), no 3/2010, p. 67This paper presents a detailed investigation of a two-stage opera-tional ampli er (OA), which is commonly used in switched-capacitornite impulse response (SC FIR) lters. A proper selection of the OAstructure for particular SC FIR lters is an important task, as it hasa direct in uence on the achievable data rate, power dissipation, chiparea, as well as selectivity of the lter. Main parameters of the OAhave been compared in the CMOS AMS 0.8 μm, 0.35 μm as well asin the TSMC 0.18 μm technologies. The best performance has beenachieved in the 0.18 μm process, as expected. The gain bandwidthproduct (GBP) equals 1.9 GHz in this case, while the power dissipa-tion is 600 μW at 1.8 V power supply. The chip area of a single OA,which equals 400 μm 2, is approximately 20 times smaller than in the0.8 μm technology. The corner analysis for different temperatures, su-pply voltages, and several transistor models for the CMOS 0.18 μmprocess is also presented in the paper.Keywords: operational ampli ers, switched capacitor lters, CMOStechnology, corner analysis

Page 8: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 8/156

ELEKTRONIKA 3/20106

Streszczenia artyku łów ● Summaries of the articles

PAWŁOWSKI P., BOROWCZYK K., MARCINIAK T., DĄ BROWSKIA.: System CCTV do automatycznego ś ledzenia obiektów w cza-sie rzeczywistymElektronika (LI), nr 3/2010, s. 71

Artyku ł prezentuje eksperymentalny system telewizji dozorowej doś ledzenia ruchomych obiektów w czasie rzeczywistym. W jego sk ładwchodzi kamera przemys łowa CC-5299 MAFS/M zamontowana na

komputerowo sterowanej obrotnicy. Zestaw jest kontrolowany zestandardowego komputera klasy PC z zainstalowanym systemem Li-nux. Zaprojektowane oprogramowanie analizuje obraz z kamery i na

jego podstawie dobiera parametry sterowania obrotnic ą . Ponadto,oprócz sterowania automatycznego, mo ż liwe jest tak że sterowanier ę czne. Szczegó łowo opisano tak że wykorzystane algorytmy ś ledze-nia obiektów.Słowa kluczowe: detekcja ruchu, wykrywanie i ś ledzenie obiektów,CCTV, system czasu rzeczywistego

PAWŁOWSKI P., BOROWCZYK K., MARCINIAK T., DĄ BROWSKIA.: Real-time CCTV system for automatic object trackingElektronika (LI), no 3/2010, p. 71This paper presents an experimental CCTV system for real time tra-cking of moving objects. It is equipped with the industry standard vi-deo camera CC-5299 MAFS/M mounted on a controlled turntable.

A PC computer operating with Linux system is used. The prepared

software analyzes the captured video and decides how to control theturntable and the camera to track the selected object. Manual systemcontrol is also possible. The implemented algorithms are discussed inthe paper in detail.Keywords: motion detection, object tracking, CCTV, real-time sy-stem

PIOTROWSKI Z.: Efektywność procedury wyznaczania poprawkiką ta fazowegoElektronika (LI), nr 3/2010, s. 76Dryft ką ta fazowego pojawiaj ą cy si ę po stronie odbiorczej ła ńcucha

telekomunikacyjnego jest niepo żą danym zjawiskiem podczas deko-dowania sygna łu oznaczonego cyfrowym znakiem wodnym. Wyniko-wa warto ść dryftu k ą ta fazowego (jittera) zale ży m.in. od stabilno ś cioscylatorów kwarcowych taktuj ą cych prac ę przetworników A/C w kar-tach d źwię kowych zainstalowanych w komputerach. Wyniki testówlaboratoryjnych prezentowane w artykule wskazuj ą na du żą efektyw-no ść procedury wyznaczaj ą cej poprawk ę k ą ta fazowego. Procedurata zosta ła uwzgl ę dniona podczas u ś redniania koherentnego widmasygna łu odbieranego.Słowa kluczowe: poprawka odstrojenia cz ę stotliwo ś ci, cyfrowe zna-kowanie wodne, u ś rednianie koherentne, jitter

PIOTROWSKI Z.: Effectiveness of the frequency offset computa-tion procedureElektronika (LI), no 3/2010, p. 76Output phase drift constitutes one of the basic problems in the water-

mark decoding process with the use of the coherent spectrum aver-aging method. Phase drift or jitter is undesirable in the output signalon the receiver’s side of the watermarking system. Phase drift resultsfrom varying stability of quartz oscillators of transmitter and receiver

A/D converters. The laboratory results presented in this paper indi-cate high effectiveness of the frequency offset computation procedureas regards phase reduction during coherent spectrum averaging ofthe received signal.Keywords: frequency offset computation, watermarking, spectrumaveraging, jitter

SKALSKI A., ZIELIŃSKI T.P., TURCZA P.: Automatyczna segmen-tacja echokardiogramów wykorzystuj ą ca metod ę zbiorów pozio-micowychElektronika (LI), nr 3/2010, s. 80W artykule zaprezentowano nowe zastosowanie metody zbiorów po-ziomicowych do segmentacji danych echokardiogra cznych. W pro-ponowanym podej ś ciu przedstawiono sposób wyznaczenia obszaruzainteresowa ń w obrazach ultrasonogra cznych bazuj ą ce na trans-formacji Hough’a oraz redukcj ę zak łóce ń wykorzystuj ą cą anizotropo-we ltry dyfuzyjne. Metoda zosta ła wst ę pnie sprawdzona na modeluwraz symulacj ą zak łóce ń . Przedstawiono wyniki segmentacji dla rze-czywistych obrazów echokardiogra cznych.Słowa kluczowe : segmentacja obrazów, USG, echokardiogra a, l-tracja dyfuzyjna, metoda zbiorów poziomicowych

SKALSKI A., ZIELIŃSKI T.P., TURCZA P.: Level set based automa-tic segmentation of ultrasound echocardiographic imagesElektronika (LI), no 3/2010, p. 80In the paper novel application of the level set method to heart seg-mentation in ultrasound echocardio graphy is addressed. In the pre-sented approach region of interest of the ultrasound image is calcu-lated by means of Hough transform and speckle noise is reduced byanisotropic diffusion lter. The method is initially validated on USG-like simulated noisy images. In article segmentation results for realechocardiograpic images are also shown.Keywords : image segmentation, USG, Echocardiography, SRAD,Level Set method

SOZAŃSKI K.P.: Cyfrowy modulator typu click modulation dlaelektroakustycznego wzmacniacza mocy klasy

Elektronika (LI), nr 3/2010, s. 84Cyfrowa realizacja modulatora typu click modulation dla elektroaku-stycznego wzmacniacza mocy. W artykule przedstawiono cyfrowymodulator typu click modulation dla wzmacniacza mocy audio klasyD. Modulator typu click modulation stanowi ciekaw ą alternatyw ę dlaklasycznych modulatorów szeroko ś ci impulsów (PWM). Modulatorzosta ł zrealizowany za pomoc ą zmiennoprzecinkowego procesorasygna łowego ADSP21065L i uk ładu FPGA typu Spartan 3 XC3100E.W artykule przedstawiono wyniki bada ń symulacyjnych i laboratoryj-nych.Słowa kluczowe : elektroakustyczny wzmacniacz mocy klasy-D, mo-dulacja szeroko ś ci impulsu

SOZAŃSKI K.P.: A digital click modulator for a class-D audiopower ampli er

Elektronika (LI), no 3/2010, p. 84This paper describes a digital click modulator for a class-D digital au-dio power ampli er. The click modulator is an interesting alternative toa classical pulse width modulator. The modulator was realized usinga oating point digital signal processor ADSP-21065L and FPGA cir-cuit Spartan 3 XC3100E. Some simulation and laboratory test resultsare presented in this paper.Keywords : class-D audio power ampli er, pulse width modulator(PWM)

Page 9: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 9/156

ELEKTRONIKA 3/2010 7

Streszczenia artyku łów ● Summaries of the articles

WEYCHAN R., MARCINIAK T., DĄ BROWSKI A.: Wpływ segmen-tacji sygna łu w procesie detekcji kodowania GSMElektronika (LI), nr 3/2010, s. 94Rozpoznawanie/identy kacja mówcy na podstawie rozmów telefonicz-nych mo że by ć ulepszona je ś li prawid łowo s ą wykryte u żyte kodekimowy. Artyku ł prezentuje detekcj ę kodowania GSM o pe łnej szybko ś ci.Konieczno ść detekcji w czasie rzeczywistym wymaga segmentacji syg-na łu mowy, co zosta ło zbadane w ś rodowisku Matlab/Simulink. Rezulta-ty eksperymentów z wykorzystaniem wybranych próbek sygna łu mowypotwierdzi ły sprawno ść zaproponowanej realizacji procesu detekcji.Słowa kluczowe: kodowanie sygna łu mowy, rozpoznawanie mówcy,segmentacja, cyfrowe przetwarzanie sygna łów

WEYCHAN R., MARCINIAK T., DĄ BROWSKI A.: In uence of sig-nal segmentation in GSM coding detectionElektronika (LI), no 3/2010, p. 94Speaker recognition/identi cation based on the analysis of telephonecalls can be improved if the involved speech coders are properly de-tected. This paper presents detection of the GSM full rate coding.Necessity of real time detection requires speech signal segmentation.It was analyzed using Matlab/Simulink environment. Results of ex-periments with the selected speech samples proved ef ciency of theproposed coding detection approach.Keywords : Speech signal coding, speaker recognition, segmenta-tion, digital signal processing

WOJTYNA R.: Analogowe przetwarzanie sygna łów odpowiedniedo sprz ętowej implementacji sieci neuronowychElektronika (LI), nr 3/2010, s. 97W pracy przedstawiono mo ż liwoś ci i ograniczenia u życia analogowegoprzetwarzania sygna łów w sieciach neuronowych. Rozpatrzono prac ę zarówno w trybie pr ą dowym, jak i napi ę ciowym. Ka żdy z nich ma swo-

je zalety i wady, ale stale wzrasta liczba przypadków, w których trybpr ą dowy wykazuje wy ższo ść nad napi ę ciowym. Wy ższo ść dotyczygłównie mniejszego poboru mocy i wi ę kszej szybko ś ci przetwarzaniasygna łów. Obie cechy s ą istotne, gdy chodzi o sprz ę tow ą implemen-tacj ę takiego przetwarzania wewn ą trz specjalizowanego uk ładu sca-lonego typu ASIC. Przedstawiono kilka przek ładów uk ładów dobrzeprzystosowanych do implementacji w technologii CMOS. G łówny na-cisk po łożono na uk łady wykonuj ą ce operacje arytmetyczne, zarównow trybie pr ą dowym, jak i transkonduktancyjnym. Jednym z interesuj ą -cych wniosków wyp ływaj ą cych z wykonanych bada ń jest fakt, że ucze-nie sieci neuronowych w sposób nienadzorowany (bez nauczyciela)

jest prostsze w realizacji sprz ę towej ni ż uczenie z nauczycielem, tj.uczenie nadzorowane. Oprócz rozwa ża ń teoretycznych, pokazanowyniki symulacji wykonanych za pomoc ą programu SPICE dla tech-nologii CMOS 0,35 um oraz projekt topologiczny (layout) prototypowejsieci Kohonena zrealizowanej w technologii CMOS 0,18 um.Słowa kluczowe: sprz ę towe przetwarzanie sygna łów, przetwarzanie w try-bie pr ą dowym, uk łady analogowe ASIC, energooszcz ędne uk łady CMOS

WOJTYNA R.: Analog signal processing suited for neural-ne-twork hardware implementationElektronika (LI), no 3/2010, p. 97In this paper, possibilities and restrictions of analog signal proces-sing applied to neural networks are considered. Both current- andvoltage-mode techniques were considered. Each of them possessesadvantages and disadvantages but the number of instances, wherethe current-mode approach is superior over the voltage-mode one isconstantly increasing. The superiority concerns mainly lower powerconsumption and higher speed of the signal processing. Both featu-res are essential when implementing the processing within an AISICintegrated circuit (Application Speci c Integrated Circuit). Several wellsuited for CMOS implementation circuit examples are presented. Themain emphasis is placed on circuits that perform arithmetic operationsin both current- and transconductance modes. One of interesting con-clusions resulting from our studies is that learning neural networksin an unsupervised way (without a teacher) is easier to implement inhardware than learning with a teacher, i.e. supervised learning. Apartfrom theoretical considerations, SPICE simulation results (0.35 umCMOS) and layout of a prototyped Kohonen network (0.18 CMOS)has been shown.Keywords: hardware signal processing, current-mode processing,analog ASIC’s, low-power CMOS circuits

BRYLSKI P., STRZELECKI M.: Architektura systemu analizy obra-zów implementujacego równoleg ły cyfrowy procesor obrazowyElektronika (LI), nr 3/2010, s. 90W artykule opisano now ą architektur ę równoleg łego, cyfrowego proce-sora obrazu, zdolnego do realizacji kilku zada ń przetwarzania takich

jak segmentacja, wykrywania kraw ę dzi oraz usuwanie szumu. Architek-tura i mody kacje algorytmu przedstawione w niniejszym dokumencie

mają

na celu zmniejszenie obszaru układu FPGA zajmowanego przezpojedynczy piksel, stanowi ą cy podstawow ą jednostk ę przetwarzania

obrazu. Proponowane mody kacje zwi ę kszaj ą funkcjonalno ść ca łegosystemu, pozwalaj ą na realizacj ę różnych operacji przetwarzania obra-zu bazuj ą cych na metodzie rozrostu obszaru, jak równie ż umo żliwiają komunikacj ę się z urz ą dzeniem za pomoc ą protoko łów internetowych.Słowa kluczowe: segmentacja, procesor obrazu, FPGA

BRYLSKI P., STRZELECKI M.: The architecture of image analysissystem for implementing parallel digital image processor Elektronika (LI), no 3/2010, p. 90This article describes a new architecture for a parallel, digital ima-ge processor which performs several image processing tasks likesegmentation, edge detection and noise removal. The architectureand algorithm modi cations presented in this paper are aimed forreduction the FPGA area of a pixel, which represents basic imageprocessing unit. The proposed modi cations increase functionality ofthe entire system by enabling different image processing operationsbased on the region growing methods as well as the possibility ofcommunication with device via Internet protocols.Keywords: segmentation, image processor, FPGA

ZBYDNIEWSKIŁ., ZIELIŃSKI T.P.: Porównanie efektywno ści zasto-sowania modulacji OFDM, Wavelet-OFDM i Circular-Wavelet-OFDMdo transmisji szerokopasmowej w instalacjach elektrycznychElektronika (LI), nr 3/2010, s. 102W artykule zaprezentowano wyniki symulacyjne zastosowania modu-latora Wavelet-OFDM bez pre ksu oraz jego cyrkulacyjnej wersji z cy-klicznym pre ksem nazywanej Circular Wavelet-OFDM do szeroko-pasmowej transmisji danych w domowych instalacjach elektrycznych.Oba modulatory zosta ły porównanie ze standardowym modulatoremwielotonowym OFDM. System Circular Wavelet-OFDM, stanowi ą cypewnego rodzaju z łożenie modulatora Wavelet-OFDM oraz OFDM,posiada wszystkie zalety pozbawionego pre ksu modulatora Wave-let-OFDM oraz jednocze ś nie wykorzystuje taka sam ą metod ę korekcjiinterferencji mi ę dzysymbolowych i mi ę dzykana łowych jak modulatorOFDM. Celem niniejszego artyku łu jest porównanie odporno ś ci wy żejwymienionych modulatorów na: szum kolorowy, interferencje w ą sko-

pasmowe oraz zak łócenia impulsowe. Zaprezentowano statystyczniewiarygodne warto ś ci bitowej stopy b łędów dla trzech rodzajów kana łówelektroenergetycznych dla systemów niekodowanych i kodowanych.Słowa kluczowe : modulacja wielotonowa, OFDM, Wavelet-OFDM,Circular Wavelet-OFDM

ZBYDNIEWSKIŁ., ZIELIŃSKI T.P.: OFDM VS Wavelet-OFDM and Cir-cular Wavelet-OFDM in high speed communication over power linesElektronika (LI), no 3/2010, p. 102This paper presents results from simulations of classic non-pre xed un-coded and coded Wavelet-OFDM and its circular version called CircularWavelet-OFDM using a cyclic pre x. Both modulators have been com-pared with standard OFDM multicarrier techniques in the high speedpower line communication environment. Circular Wavelet-OFDM, asa hybrid modulation scheme lying between Wavelet-OFDM and OFDM,has all advantageous of non-pre xed Wavelet-OFDM, additionally solv-ing problem of equalization in the same way as in pre x-based OFDM.The main purpose of this article is focused on investigation of robust-ness of the mentioned above modulation schemes to coloured noise,narrowband interference and, additionally, to impulsive disturbances.Statistically reliable calculation of BER performance is done by meansof statistical modeling of three types of power line channels having dif-

ferent quality and by using statistical models of disturbance.Keywords : multicarrier modulation, OFDM, Wavelet-OFDM, CircularWavelet-OFDM

Page 10: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 10/156

ELEKTRONIKA 3/20108

Streszczenia artyku łów ● Summaries of the articles

TURCZA P., ZIELIŃSKI T.P., LAY-EKUAKILLE A.: Automatycznaestymacja grubo ści błony wewnętrznej i środkowej t ętnicy szyjnejElektronika (LI), nr 3/2010, s. 109W artykule zaproponowano efektywn ą metod ę do automatycznej esty-macji po łożenia brzegów b łony wewn ę trznej i ś rodkowej t ę tnicy szyj-nej, bazuj ą cą na analizie obrazu USG. Odleg łość pomi ę dzy brzegamitych b łon nosi nazw ę grubo ś ci intima-media i jest wykorzystywana do

prognozowania ryzyka sercowo-naczyniowego (zawa łów, udarów).W chwili obecnej grubo ść intima-media jest mierzona drog ą r ę cznegopodzia łu na cz ęś ci obrazu USG t ę tnicy szyjnej przez lekarza. Automa-tyczna estymacja tej grubo ś ci uwolni lekarza od tego czasoch łonnegozaj ę cia i zapewni wi ę ksz ą powtarzalno ść pomiaru. Algorytm oblicze-niowy zaproponowany w artykule wykorzystuje nieliniow ą ltracj ę dyfuzyjn ą do skutecznego odszumiania obrazu USG oraz iteracyjn ą segmentacj ę obrazu za pomoc ą zmody kowanej metody aktywnychkonturów, wykorzystuj ą cej odpowiednio dobran ą funkcj ę energii.Słowa kluczowe : USG, intima-media, estymacja grubo ś ci b łony we-wnę trznej, odszumianie obrazu USG, zmody kowana metoda aktyw-nych konturów

TURCZA P., ZIELIŃSKI T.P., LAY-EKUAKILLE A.: Automatic esti-mation of the intima-media thickness of the common carotid ar-teryElektronika (LI), no 3/2010, p. 109In this paper we propose ef cient method for automatic estimation ofintima and media boundary of common carotid artery (CCA) based onUSG image analysis. The distance between intima and media is cal-

led intima-media thickness (IMT) and is used to predict cardiovascularevents like myocardial infarction and stroke. At present, it is measu-red by manual segmentation of USG image by physician. Automaticestimation of IMT by freeing physician from this tedious work shouldspeed the process and assure higher reproducibility. The proposed al-gorithm involves USG image de-noising by nonlinear diffusion lteringand iterative image segmentation by modi ed active contour methodwith suitable energy function.Keywords : USG, intima-media thickness, image segmentation, ima-ge de-noising, SRAD, active contours

WIEJAK W., WYMYSŁOWSKI A.: Uproszczony analityczny modelrozpraszania mocy w linii opó źniają cej lampy fali bie żą cejElektronika (LI), nr 3/2010, s. 114

W artykule przedstawiono analityczn ą metod ę wyznaczania rozk ładumocy rozpraszanej w linii opó źniaj ą cej (LO) lampy fali bie żą cej (LFB)oraz analiz ę termiczn ą jej struktury w oparciu o model numeryczny.Straty mocy wydzielane w LO w postaci ciep ła wynikaj ą z przechwytucz ęś ci pr ą du wi ą zki elektronowej w procesie wzmacniania mocy mi-krofalowej oraz strat mikrofalowych wyznaczanych ze sta łej t łumienia.

Analiz ę przeprowadzono w obecno ś ci za łoże ń upraszczaj ą cych po-zwalaj ą cych na sformu łowanie zagadnienia przechwytu mocy wi ą z-ki elektronowej w postaci równania ró żniczkowego o analitycznymrozwi ą zaniu. Uzyskane wyniki rozk ładu g ę sto ś ci mocy rozpraszanejzastosowano dla rzeczywistej struktury linii opó źniaj ą cej LFB. Pozwo-liło to na obliczenie metodami numerycznymi obci ąż enia termicznegoLO, istotnego dla okre ś lenia niezawodno ś ci lampy.Słowa kluczowe: LFB, lampa fali bie żą cej, moc strat, linia opó źniaj ą ca

WIEJAK W., WYMYSŁOWSKI A.: Simplifed analytical model ofpower dissipation in delay line of traveling wave tubeElektronika (LI), no 3/2010, p. 114

The paper presents analytical approach to determination of a dissi-pated power distribution in a slow wave structure (SWS) of the travel-ing wave tube (TWT). The power dissipated on DLS, in a form of heatresults from an interception of beam electrons during the ampli cationprocess and from microwave losses. Calculation have been madewith some simplifying assumption allowing formulate the differentialequation of the power distribution and its analytical solution. Theoreti-cal analyses of density power distribution provide data to numericalapproach of temperature distribution in DLS and nally to increasereliability factor of all TWT.Keywords: TWT, travelling wave tube, power dissipation, delay linestructure

SZCZYPIŃSKI R., JABŁOŃSKA-KUGLER E., BARANIECKA A., PI-JANOWSKA D.G.: Miniaturyzacja cytometru przep ływowegoElektronika (LI), nr 3/2010, s. 120Jedn ą z metod wykorzystywanych w diagnostyce klinicznej jest cyto-metria przep ływowa, która jest oparta na pomiarach zycznych i/lubchemicznych w ła ś ciwo ś ci pojedynczych komórek, a tak że mikrocz ą -steczek podczas ich przep ływu przez mikrokana ł. W ci ą gu ostatnichkilku lat pojawi ł si ę szereg publikacji dotycz ą cych miniaturyzacji apa-ratury s łużą cej do tego typu bada ń .W artykule przedstawiono przegl ą d rozwi ą za ń budowy cytometrówmikroprzep ływowych oraz wst ę pne wyniki bada ń w łasnych dotycz ą -cych ogniskowania hydrodynamicznego cieczy w mikrokanale struk-tury testowej cytometru mikroprzep ływowego.Słowa kluczowe: PDMS, cytometr mikroprzep ływowy, mikrouk ładyanalityczne, detekcja optyczna

SZCZYPIŃSKI R., JABŁOŃSKA-KUGLER E., BARANIECKA A., PI-JANOWSKA D.G.: Miniaturization of ow cytometer Elektronika (LI), no 3/2010, p. 120One of the methods of clinical diagnosis is ow cytometry, which isbased on measurements of physical and/or chemical properties of in-dividual cells or microparticals during their ow along a microchannel.For the last few years, many publications on miniaturization of thattype of systems have appeared.In this paper, a review of micro ow cytometers and own prelimina-ry results on hydrodynamic focusing of liquid in the microchannel ofa test micro ow cytometer structure.Keywords: PDMS, micro ow cytometer, microanalysis systems, op-tical detection

CZAJKOWSKI R., NOWAKOWSKI W.: O protokóle Ekerta w kryp-togra i kwantowejElektronika (LI), nr 3/2010, s. 126W artykule podano ogólne informacje o zastosowaniu zjawiska EPRw kryptogra i kwantowej (protokó ł Ekerta)Słowa kluczowe: kryptogra a kwantowa, EPR, Ekert

CZAJKOWSKI R., NOWAKOWSKI W.: About Ekert (EPR) protocolin quantum cryptographyElektronika (LI), nr 3/2010, s. 126General information about EPR and Ekert algorithm application inquantum cryptography is given.Keywords: quantum cryptography, quantum information processing,EPR, Ekert

BRZOSTEK-PAWŁOWSKA J.: Modele e-learningu w reklamie te-lewizyjnej …?Elektronika (LI), nr 3/2010, s. 128

Artyku ł przedstawia g łówne trendy potrzeb oraz rozwoju systemówinformacyjnych ró żnego zastosowania, jak równie ż tez ę o mo ż liwoś ciwykorzystania modeli e-learningu, zawartych w standardach SCORM2004 i IMS Common Cartridge, nie tylko w systemach edukacyjnych.Zagadnienia zostan ą szerzej omówione w nast ę pnym numerze Elek-troniki .Słowa kluczowe : e-learning, systemy edukacyjne, SCORM 2004

BRZOSTEK-PAWŁOWSKA J.: Models of the e-learning in a TVcommercial…?Elektronika (LI), no 3/2010, p. 128The article presents main trends of needs and the development ofinformation systems of different applying, as well as shows the the-sis about the possibility of using models of the e-learning, containedin standards SCORM 2004 and IMS Common Cartridge, not only inthe educational systems. The wider review of these problems will beincluded in the article in the next edition of Elektronika.Keywords : e-learning, educational systems, SCORM 2004

Page 11: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 11/156

Page 12: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 12/156

ELEKTRONIKA 3/201010

Rozmowy na telefony alarmowe s ą w Polsce rejestrowane, jednak ze wzgl ę du na ich du żą liczb ę , w chwili obecnej nie jest jeszcze mo ż liwe odnalezienie odpowiednich informacji(np. potrzebnych do identy kacji mówcy) bez wykorzystaniaznacznych zasobów ludzkich, a wi ę c po ś wię cenia temu za-daniu du żych nak ładów czasowych i nansowych. Z tego po-wodu jednym z celów prowadzonego przez autorów projektunaukowego jest opracowanie bazy danych zawieraj ą cej infor-macje o rozmowach i narz ę dzia do wielopoziomowego wspo-

magania rozpoznawania mówcy, tj. metody wykorzystuj ą cezarówno cechy g łosu, jak i lingwistyczne cechy wypowiedzimówcy. Narz ę dzia te s ą oparte na implementacji algorytmówwielopoziomowej analizy sygna łów i anotacji danych wykony-wanej przez operatora telefonu i/lub automatycznie za pomo-cą rejestratora rozmów.

Eksperymenty rozpocz ę to od nagra ń wideo specjalniezaprojektowanych scen wybranych zagro że ń w ś rodowiskumiejskim. Nagrania te zosta ły zaprezentowane osobom, któremusia ły zadzwoni ć do centrum telefonicznego i zrelacjono-wa ć zaobserwowan ą sytuacj ę . Rozmowy telefoniczne zosta łyzarejestrowane wraz z dodatkowymi informacjami wprowa-dzonymi przez operatora telefonu.

W niniejszym artykule opisano źród ła danych, metodygeneracji metadanych, architektur ę , metody wyszukiwaniarozmów o podobnych cechach i implementacj ę rozwijanegosystemu.

Źródła danychBaza rozmów na telefony alarmowe jest przyk ładem bazy da-nych opisuj ą cej rzeczywiste zdarzenia [1, 2]. W naszym przy-padku mamy do czynienia z sytuacjami zagro że ń rejestro-wanymi w czasie, kiedy ś wiadek lub o ara dzwoni na policj ę informuj ą c operatora telefonu, co si ę wydarzy ło. Do potencjal-nych źróde ł informacji mo żna zaliczy ć :• plik d źwię kowy,• rejestrator rozmów i operatora linii (ustalenie numeru i lo-

kalizacji telefonu, z którego zosta ło ustanowione po łą cze-nie),

• operatora telefonu,• charakterystyk ę zdarzenia zrelacjonowan ą przez osob ę

dzwoni ą cą ,• transkrypcj ę lub anotacj ę zazwyczaj wykonywan ą w trybie

off-line przez cz łowieka lub maszyn ę .Dane audio s ą wprowadzane do bazy danych z urz ą dze-

nia do nagrywania rozmów telefonicznych (modu łu NetCRR[3]) w postaci cyfrowej. Rejestrator rozmów pozwala równie ż na zapis dodatkowych istotnych informacji o technicznymcharakterze po łą czenia takich jak: data wykonania, godzina

i czas rozmowy, numer telefonu, itd.Innym źród łem opisu danych s ą informacje o rozmowie

wprowadzane r ę cznie przez operatora telefonu, czyli przezosob ę obs ługuj ą cą telefon. Operator mo że rozpozna ć cha-

Koncepcja multimedialnej bazy danychdo rejestracji i przeszukiwania rozmów

na telefony alarmowemgr inż. JULIAN BALCEREK, mgr SZYMON DRGAS, prof. dr hab. inż. ADAM DĄ BROWSKI,

mgr inż. ADAM KONIECZKAPolitechnika Pozna ńska, Wydzia ł Informatyki i Zarz ą dzania, Katedra Sterowania i In żynierii Systemów

rakterystyczne cechy g łosu osoby dzwoni ą cej, t ło akustycz-ne oraz dostarczy ć informacje o zdarzeniu relacjonowanymprzez osob ę dzwoni ą cą . Uzyskane informacje i w łasne opinieo rozmowie operator mo że umie ś cić w bazie za pomoc ą gra-cznego interfejsu u żytkownika.

Dane o nagraniu s ą używane podczas wyszukiwania istot-nych rozmów, np. z g łosem tej samej osoby. Wp ływaj ą onepozytywnie na skuteczno ść systemu. Jednak dodawanie zbytwielu danych wymaga sporo czasu, którego mo że brakowa ć

pomi ę dzy kolejnymi rozmowami. Ponadto, operatorzy mog ą pope łnia ć b łędy w czasie wprowadzania warto ś ci do formu-larza – mog ą b łędnie oceni ć wiarygodno ść mówcy lub wyda ć subiektywn ą opini ę .

Jednym z celów pracy by ł dobór cech wprowadzanychprzez osob ę prowadz ą cą rozmow ę po stronie operatora te-lefonu alarmowego w taki sposób, żeby ich liczba by ła jaknajmniejsza a wiarygodno ść oceny przez s łuchacza jak naj-wię ksza.

Do najwa żniejszych cech opisuj ą cych mówc ę nale żą p łe ć i wiek. Informacja o p łci mo że pos łużyć do ustawienia warun-ków pocz ą tkowych podczas trenowania modeli statystycznychg łosu mówcy oraz do wyboru modelu ś wiata w trakcie rozpo-znawania. Pomimo faktu, że p łe ć mo że by ć rozpoznawanaautomatycznie z du żą skuteczno ś cią w ciszy [4], ludzie mog ą rozpozna ć ją poprawnie w przypadku nagra ń z du żym pozio-mem zak łóce ń i zniekszta łce ń . Warto doda ć , że wiarygodno ść oceny p łci przez cz łowieka jest zale żna od wieku. Najwi ę kszyb łą d jest uzyskiwany dla g łosów nale żą cych do dzieci [5].

Kolejn ą cech ą osobnicz ą , która mo że wspiera ć rozpozna-wanie osób jest wiek mówcy. Badania przeprowadzone przezSchotza pokazuj ą , że s łuchacze potra ą oszacowa ć wiekw pewnym zakresie, jednak z b łędem mog ą cym przekracza ć 10 lat [6, 7].

Informacja o stanie emocjonalnym mówcy równie ż mo żeokaza ć si ę użyteczna w rozwijanym systemie. Mo że zosta ć ona wykorzystana do przypisania odpowiednich wag dla ró ż -nych cech automatycznie wyekstrahowanych przez system.Jako przyk ład mo żna wskaza ć sytuacj ę , gdzie porównywanes ą dwa nagrania, w których mówcy s ą w innym stanie emo-cjonalnym, wtedy cechy prozodyczne mog ą by ć ź ród łemb łędu rozpoznawania mówcy i nale ży przypisa ć im mniejsz ą wag ę .

Wady wymowy, takie jak j ą kanie s ą cechami dystynktyw-nymi mówców. Dlatego ich obecno ść powinna by ć wzię ta poduwag ę w algorytmie przeszukiwania bazy danych.

Innym aspektem, który wydaje si ę wa żny, jest t ło akustycz-ne. Informacja o nim mo że zosta ć wykorzystana do wyborumetod przetwarzania sygna łów w celu zredukowania znie-kszta łce ń i zak łóce ń .

Informacje o wydarzeniu relacjonowanym przez osob ę dzwoni ą cą mog ą s łużyć do wyboru odpowiedniego mode-lu lingwistycznego i do ulepszania systemu rozpoznawaniamowy, który mo że wspiera ć dzia łanie bazy danych.

Page 13: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 13/156

Page 14: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 14/156

ELEKTRONIKA 3/201012

Obrazy o najwy ższej punktacji to obrazy najbardziej podobnedo obrazu odniesienia [16].

W rozwijanym systemie zaproponowano porównywaniepól rekordów przy u życiu funkcji podobie ństwa i systemupunktacji opartego na najlepszych dopasowaniach, czyli nanajwi ę kszej warto ś ci tzw. globalnej punktacji. Globalna punk-tacja jest wa żon ą sum ą warto ś ci funkcji podobie ństwa. Wi ę k-sza warto ść wagi cechy oznacza, że ta cecha jest wa żniejszaw procesie wyszukiwania.

Metryki w przestrzeniach metrycznych mog ą by ć podzie-lone na klasy: binarne, numeryczne i oparte na terminachz podanego s łownika lub zbioru [14]. W zaprezentowanychmetodach wyszukiwania skupiono si ę na analizie cech se-mantycznych reprezentowanych przez istotne porównywalnecechy [17]. Dla danych wej ś ciowych nie b ę dą cych danyminumerycznymi, zde niowano warto ś ci tzw. funkcji podobie ń-stwa.

Najprostsza zaproponowana metoda opiera si ę na do-kładnych binarnych dopasowaniach, które s ą wa żone po-przez wagi w j w odniesieniu do wa żno ś ci j -tego pola w i -tymrekordzie. Porównuj ą c nowo dodany do bazy rekord z i -tymrekordem, znajduj ą cym si ę w bazie, otrzymuje si ę globaln ą

punktacj ę s i wyra żon ą jako:

(1)

gdzie: j – to indeks pola, a j – j -te pole nowo dodanego rekordu,b ij – j -te pole w i -tym rekordzie przechowywanym w bazie, w j

– waga j -tego pola w i -tym rekordzie przechowywanym w ba-zie, δ (a j , b ij ) – impuls delta Kroneckera zde owany jako:

(2)

Wagi w j s ą osobno de niowane dla ka żdego pola (cechy)i zale żą od znaczenia danej cechy. Zak łada si ę , że dla wszyst-kich rekordów wa żno ś ci tych samych cech s ą identyczne.Operacja porównywania jest przeprowadzana dla ka żdegorekordu w bazie. Wynikiem s ą rekordy z najwi ę kszymi war-toś ciami globalnej punktacji s i o liczebno ś ci zde niowanejw zale żno ś ci od potrzeb. Jest to grupa rozmów telefonicznychw bazie, które s ą najbardziej podobne do nowej (ostatniej)rozmowy. Tym samym mamy do czynienia z grup ą rozmów-ców, którzy s ą najbardziej podobni do osoby, która w ła ś niedzwoni ła na numer alarmowy.

W bardziej zaawansowanej metodzie, opartej na cechachsemantycznych, u żywane s ą wa żone warto ś ci funkcji podo-bie ństwa b ę dą ce elementami macierzy P j zde niowanej dlawszystkich pól o j -tych indeksach. Globalna punktacja s i jestzde niowana jako:

(3)

gdzie: p kl jest warto ś cią funkcji podobie ństwa i jest elementemmacierzy podobie ństwa P j w k -tym rz ę dzie i l -tej kolumnie.Macierz P j zosta ła zde niowana jako:

(4)

∑−

=rekordu póltych- jwszystkich

),(tegoi

ij j ji baw s δ∑−

=rekordu póltych- jwszystkich

),(tegoi

ij j ji baw s δ

( ) ≠

==

ij j

ij jij j ba for

ba for ba

0

1,δ

( ) ≠

==

ij j

ij jij j ba for

ba for ba

0

1,δ

∑=rekordutego-i póltych- jwszystkich

kl ji pw s ,∑=rekordutego-i póltych- jwszystkich

kl ji pw s ,

[ ]==

nnnnn

n

n

n

kl j

p p p p

p p p p

p p p p

p p p p

p P

...

...............

...

...

...

321

3333231

2232221

1131211

,

[ ]==

nnnnn

n

n

n

kl j

p p p p

p p p p

p p p p

p p p p

p P

...

...............

...

...

...

321

3333231

2232221

1131211

,

gdzie: n (rozmiar macierzy P j ) jest liczb ą różnych argumentów d k , d l zawartych w poszczególnych j -tych polach rekordów re-prezentowanych przez wektor argumentów:

(5)

Funkcja p kl porównuje argument d l (l -ty element wektoraD j ) j -tego pola i -tego rekordu z bazy z argumentem d k (k -tyelement wektora D j ) j -tego pola w nowo dodanym rekordzie.

Przyjmuje si ę , że dla danego pola wszystkim rekordom od-powiada taki sam wektor D j . Macierz P j jest kwadratowa, aleniekoniecznie symetryczna.

Prosty przyk ład ilustruj ą cy przedstawion ą metod ę wyszu-kiwania danych dotyczy odleg łoś ci pomi ę dzy trzema miastamiw Polsce: Poznaniem, Łodzi ą i Warszaw ą . Wektor argumen-tów zde niowano jako:

(6)

Macierz podobie ństwa P zosta ła sformu łowana jako:

(7)

Dla podanych miast zde niowano podobie ń stwa, jakowarto ś ci malej ą ce wraz z odleg ło ś ciami pomi ę dzy tymi mia-stami. Du ża warto ść p kl (maksymalnie równa 1) oznacza,że odleg łość pomi ę dzy miastami jest ma ła i tym samymprawdopodobie ństwo pobytu tej samej osoby w krótkim od-st ę pie czasu w obu miastach jest du że. Z drugiej strony,ma ła warto ść p kl oznacza, że odleg łość pomi ę dzy miasta-mi jest du ża i tym samym prawdopodobie ństwo pobytu tejsamej osoby w obu miastach jest ma łe. Tak, wi ę c najwi ę k-sze warto ś ci macierzy P (równe 1) s ą na g łównej przek ą t-nej.

Wagi w j w równaniu (3) maj ą warto ś ci, które zale żą odwa żno ś ci cechy okre ś lonej przez j -te pole. Ich prede niowanawarto ść jest równa 1.

Dalszy rozwój systemu bazy danych b ę dzie wymaga ł za-stosowania bardziej zaawansowanych metod wyszukiwania,które uwzgl ę dni ą równie ż korelacje pomi ę dzy zmiennymi. Zo-stanie wzi ę te pod uwag ę jak parametry mog ą zmienia ć się w czasie i zostan ą zde niowane dodatkowe zale żno ś ci np.poprzez dodatkowe wagi.

Zaprezentowane metody dotycz ą g łównie danych seman-tycznych, które pierwotnie nie s ą wyra żane, jako dane nume-ryczne.

ImplementacjaNarz ę dziem wykorzystywanym na dotychczasowym etapierozwoju systemu jest pakiet narz ę dzi serwerowych XAMPP[18]. U żyto systemu zarz ą dzania baz ą danych MySQL . Doobs ługi danych wykorzystano PHP , czyli skryptowy obiekto-wy j ę zyk programowania po stronie serwera [19]. Serweremsieci Web jest serwer Apache , a hipertekstowym j ę zykiemznaczników HTML. Pewne otwarte kwestie dotycz ą zagad-nienia po łą czenia systemu z modu łem NetCRR poprzez j ę zyk

skryptowy.Gra czny interfejs u żytkownika jest przyjazny u żytkowni-

kowi, co oznacza, że niepotrzebnie nie obci ąż a operatora te-lefonu. Formularz operatora przedstawiono na rys. 2 .

[ ]T n j d d d D ,...,, 21= . [ ]T n j d d d D ,...,, 21= .

T Warszawa Łódź Poznań D ],,[= .T Warszawa Łódź Poznań D ],,[= .

[ ]==16,02,0

6,013,0

2,03,01

kl p P

.

[ ]==16,02,0

6,013,0

2,03,01

kl p P

.

Page 15: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 15/156

ELEKTRONIKA 3/2010 13

Z poziomu menu bazy danych mo ż liwe jest przegl ą daniei edycja rekordów, a tak że opcji wyszukiwania oraz edycji wagi macierzy wag za po ś rednictwem formularzy. Wiele innychopcji jest dost ę pnych równie ż z poziomu narz ę dzi pakietu

XAMPP takich jak phpMyAdmin .

PodsumowanieZaprojektowano i zaimplementowano system bazodanowy doprzechowywania informacji potrzebnych do identy kacji osóbnadu żywaj ą cych telefony alarmowe. Zaprezentowano archi-tektur ę systemu wraz z metodami wielopoziomowej analizysygna łów i metodami przeszukiwania danych, opartymi nawa żonych impulsach delta Kroneckera i wa żonej macierzypodobie ństwa.

Aktualnie trwa proces gromadzenia danych (rejestracjarozmów telefonicznych, zawieraj ą cych opisy zdarze ń przed-stawionych w eksperymentalnych lmach). Dalsze pracebę dą polega ły na testowaniu skuteczno ś ci opracowanych al-gorytmów i ich optymalizacji.

Praca jest wspó ł nansowana z projektów PPBW i 93-72/10 BW.

Literatura [1] Pingali G. S. i in.: Instantly Indexed Multimedia Databases of

Real World Events. IEEE Transations on Multimedia, vol. 4, no.2, June 2002, pp. 269-282.

[2] Xi Li; Tiyan Shen, Jinjie Zhang, Changmin Shi: A Spatial Tech-nology Approach to Campus Security. Networking, Sensing andControl, ICNSC, IEEE International Conference, 6-8 April 2008,pp. 221 – 225.

[3] NetCRR digital call recorder. Catalogue card, www.dgt.com.pl. [4] Sigmund M., Dostal T.: Automatic Gender Distinction by Voice. In

Proceedings Arti cial Intelligence and Applications – 2005. [5] Traunmüller H.: Perception of speaker sex, age, and vocal effort.

Phonum 4, 1997, pp. 183 – 186. [6] Schötz S.: A perceptual study of speaker age. In Papers from

FONETIK 2001, Working Papers, 49, Department of Linguisticsand Phonetics, Lund University, pp. 136–139.

Rys. 2. Formularz dodawania danych do bazy przez operatoraFig. 2. Form for data inserting by phone operator

[7] Schötz S.: Some acoustic cues to human and machine estima-tion of speaker age. In Proceedings of Fonetik 2004, Stockholm,pp. 40–43.

[8] Subramanya S. R.: Multimedia databases – Issues and chal-lenges. IEEE Computer, December 1999/January 2000, pp.16-18.

[9] Van Reeth F. I in.: A Distributed Video Retrieval System Utilis-ing Broadband Networked PC’s for Educational Applications.Proceedings of the 1998 Conference on MultiMedia Modeling,pp.47-48.

[10] Reveiu A., Dardala M., Smeureanu I.: A MPEG-21 Based Archi-tecture for Data Visualization in Multimedia Web Applications.International Conference Visualisation, 2008, pp. 84-89.

[11] Samet H.: Indexing Methods for Similarity Searching. CurrentTrends in Computer Science, ENC, Eighth Mexican InternationalConference, 24-28 September 2007, pp. xv-xv.

[12] Królikowski Z., Wojciechowski M.: Zaawansowane systemy bazdanych – ZSBD. Multimedialne bazy danych. Educational mate-rials, 2006, http://wazniak.mimuw.edu.pl.

[13] Zezula P. i in.: Similarity Search – The Metric Space Approach,volume 32 of Advances in Database Systems, Springer,2006.

[14] Allasia W. i in.: An Innovative Approach for Indexing and Search-ing Digital Rights. Proceedings of the Third International Con-ference on Automated Production of Cross Media Content forMulti-Channel Distribution, 2007, pp. 147-154.

[15] Tao Li, Ogihara M.: Content-based music similarity search andemotion detection. Proceedings of IEEE International Confer-ence on Acoustics, Speech, and Signal Processing, 17-21 May2004., pp. V- 705-8 vol. 5.

[16] Berrani S.-A., Amsaleg L., Gros P.: Robust content-based imagesearches for copyright protection. In Proc. of the ACM Int. Work-shop on Multimedia Databases, New Orleans, Louisiana, USA,November 2003, pp. 70–77.

[17] Announcing the Standard for Integration De nition For Informa-tion Modeling (IDEF1X), Federal Information Processing Stand-ards Publication 184, 21 December 1993, released of IDEF1Xby the Computer Systems Laboratory of the National Institute ofStandards and Technology (NIST).

[18] XAMPP home web page, http://www.apachefriends.org/en/xam-pp.html.

[19] Olson P. i in.: PHP Manual. 1997-2010, the PHP DocumentationGroup, http://www.php.net/manual/en/index.php.

Page 16: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 16/156

ELEKTRONIKA 3/201014

Operations performed during mastering audio material maybe divided into two categories: interactive and batch actions.Interactive must be supervised by an operator monitoring andadjusting parameters in real-time. Perceiving sound is subjec-tive, so no computer can handle this human task. On the otherhand there are some operations that do not require immediateattention, those are called batch jobs. In most cases an op-erator chooses what should be done, sets all parameters andstarts processing. All other things are done automatically, the

only thing an operator must do is to watch for errors and waitfor the task to end. Modular Audio Processing System (for shortMAPS) was designed as a robust library for batch processing.

Diagrams and graphs are a very convenient way of sho-wing principles of operation as they decompose complicatedsystems into simple blocks. The same can be done to almostany audio processing system. The design goal of MAPS wasto provide those basic blocks and enable user to create com-plex systems by easily linking those blocks.

As it was mentioned before, MAPS is capable of runningon almost any modern PC with Microsoft Windows XP/Vista orLinux operating system installed. The library is written in plainC++ which makes it portable and robust.

There were two main reasons, why C++ has been chosen:it is compiled to native machine code and it’s object-oriented.First feature ensures top performance [1]. Not so long agoonly dedicated digital signal processors were capable of l-tering signal in real-time. Nowadays Intel x86 CPUs with anintegrated x87 FPUs are cheap and powerful and despite be-ing general purpose CISC processors they can handle DSPas well.

The object-oriented approach allows programmers to usegeneral interfaces and encapsulation. The library providesset of blocks that share common interface and hide details ofoperation behind it. The user is presented only few methodsthat set parameters, allow block interconnection and do theprocessing.

The MAPS is an unique software because it uses xed-po-int arithmetics for processing signal. Floating-point numberswhich are commonly used in other audio programs have someserious drawbacks. The defects will be described in the nextsection.

Fixed-point vs. oating-pointBoth ways of storing numbers in computer’s memory usetwo’s complement code, which is a slight modi cation of thenatural binary code. An n bit number stored in two’s comple-ment code has a value of:

(1)

where Dn is n th digit of number – right-most digit has an indexof 0.

ii

n

i

nn d d x 22=

2

0=

11 +− ∑

−−

−i

i

n

i

nn d d x 22=

2

0=

11 +− ∑

−−

Fixed-point numbers are stored the same way. The onlydifference is placement of radix point, not behind the last digitbut somewhere inside the word. Let’s consider an n-bit num-ber with m-bit fractional part. It’s value is as follows:

(2)

Floating-point numbers are stored using exponential formula:

(3)

where S is sign of the number, F is a fractional part, E is anexponent and B is a constant enabling negative exponents. S,F and E are non-negative integers. The lengths and positionof these elds in IEEE754 single standard are shown in [2].

To compare which numbers are better for audio processingfurther analysis has to be conducted. The two most commonoperations used in digital signal processing are addition andmultiplication which are often combined into Multiply And Ac-cumulate (MAC) instruction of DS processors.

The case of xed-point numbers is simple. Addition isprecise as long as the operation does not cause over ow. Itis common to use result world longer than terms’ word, thuspreventing over ow. The result of multiplication of two n-bitnumbers is 2 n-bits long and has to be stored in a word of thislength. To restore initial length the result has to be somehowtruncated, in most cases rounding is used:

(4)

It is possible to minimize the rounding error while calcula-ting convolution. The solution is similar to those used in digitalsignal processors – using a temporal variable that has at leasttwo times more bits than input operands. This way the roun-ding happens only once for an output sample.

Operations on oating-point numbers are more complica-ted. Addition can be explained using symbols from equation 1(assume x > y ):

(5)

Fractional parts may be added ( M 1 + M 2 ) only after beingbrought to the same, bigger of the two, exponents ( E 2 ). This isequal to shifting smaller mantissa right and may lead to a lossof precision whenever exponents do not match.

Multiplication of two oating-point numbers can be descri-bed by following equation:

(6)

Please note that M 1 · M 2 is xed-point multiplication androunding is incorporated. It should be also mentioned that

m

ii

n

i

nn d d

x2

22=

2

0=

11 +− ∑

−−

m

ii

n

i

nn d d

x2

22=

2

0=

11 +− ∑

−−

B E S F x −− 21)(= B E S F x −− 21)(=

+ LSB x x21

=~ + LSB x x21

=~

11221 2)2(=

E E E M M y x ++ − 112

21 2)2(= E E E

M M y x ++ −

212121 2= E E

M M S S y x +

212121 2= E E

M M S S y x +

Implementation of synchronous sample rateconverter using modular audio processing system(Implementacja synchronicznego konwertera cz ęstotliwo ści próbkowania

z wykorzystaniem modularnego systemu przetwarzania sygna łów fonicznych)

dr inż. PIOTR BOBIŃSKI, mgr inż. BARTOSZ BIELAWSKI, mgr inż. PIOTR NYKIELWarsaw University of Technology, Institute of Radioelectronics

Page 17: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 17/156

ELEKTRONIKA 3/2010 15

exponential format used to store oating-point numbers cau-ses quantum to be non-uniform. This leads to quantizationerror begin correlated with input signal and modulative in-terference [3].

Floating-point numbers seem to be the best choice forscienti c calculations where a wide range of magnitudes isused. Audio processing is not the case, the signal dynamicrange is well known. Fixed-point arithmetics allows designersto control signal processing with accuracy of a single bit, and

that is why it was chosen to be used in MAPS.

MAPS architectureThe MAPS library was designed to be modular, yet easy touse. All entities used in signal processing were divided intotwo categories: buffers and lters.

Buffers are blocks used for storing data, it can be both au-dio signal as well as lter’s coef cients. Buffers are partiallyaware of their contents, besides samples, sample rate, num-ber of channels and bit depth is transferred. Internally data isstored as 32-bit integers, but all system blocks support usingmost signi cant bits (up to 8) as integer part. Buffers automa-

tically manage memory for it’s contents and can load and savedata from/to text les.Filter is not really a block, but rather an interface for spe-

cic ones. The general interface depicted in Fig. 1 allows sof-tware to use same functions to perform common tasks on allobjects driven from lter.

Below a short description of all blocks is presented withdiagrams for the most important blocks.• FIR lter ( r_ lter) is a block that convolves input signal

x[n] with coef cients h[n] . This block has one input buffer,

one output buffer, supports signal dithering and genera-tes pseudo-random data for dither block. The diagram isshown in the Fig. 3 .

Fig. 1. Common lter interfaceRys. 1. Interfejs klasy lter

It was assumed that each block creates and controls onlyit’s output buffers, while input data is acquired using pointersto other buffers. This enables a buffer to be source of signal toany number of buffers. The most important functions are:• set_{input|coeffs|dither}_buffer() – sets the corresponding

buffer and does the error checking; input version conFig.s block to work with the given buffer; some blocks do notimplement all of these functions (e.g. delayline doesn’t su-pport setting coef cients buffer),

• get_{output|random}_buffer() – returns a pointer to cor-responding buffer; if the parameter is invalid or the blockdoes not support this feature – returns NULL; not all ofthese functions are implemented in all blocks,

• {set|get}_out_bits() – sets or gets the number of signi cantbits in the output buffer(s),

• ush() – ushes all delay lines and buffers in block, setsinternal parameters to default values,

• process() – processes data, kind of processing dependsheavily on the type of the block,

• the MAPS library supports currently 9 types of blocks, theirnames and functions are presented in the Fig. 2 .

Fig. 2. Division of objects by their functionRys. 2. Podzia ł bloków ze względu na ich funkcj ę

Filter (f i l ter)

FIR filter (fir_filter)

PolyFIR filte r (polyfir_filter)

Multiplexer (mux)

Demultiplexer (demux)

Input f i le(infile)

Output file(outfile)

Dither generator (di ther)

Delayline(delayline)

Adde r (adder)

Buffer (buffer)

Si gn al f il te ri ng D at a m u lt ip le x in gand demultiplexing

Input/output Additional

Virtual class

I nh er it an ce Use s

Similar blocks

Fig. 3. The FIR lter diagramRys. 3 Diagram ltra typu FIR

• PolyFIR lter (poly r_ lter) supersedes r_ lter by ena-bling polyphase ltering. Coef cients for all sub ltersare provided by coef cient buffer. User must also set L (interpolation) and M (decimation) factors using set_ l-ter_ratio(). Please note that poly r_ lter may upsampleas well as downsample signal. The diagram is shown inthe Fig. 4 .

Fig. 4. The PolyFIR lter diagramRys. 4. Diagram ltra typu P:olyFIR

Page 18: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 18/156

ELEKTRONIKA 3/201016

• Delay line (delay_line) delays input signals by N samples.N must be set using set_delay(). Delay line supports dit-hering, but can’t be a source of random data for dither ge-nerator.

• Multiplexer (mux) interleaves two or more buffers into onebuffer. It is commonly used just before output le block toprepare data for being written into le. The number of in-puts is set in constructor (mux()).

• Demultiplexer (demux) separates one buffer into two or

more buffers. It is commonly used to disjoin channels ininput le buffer. The number of outputs is set in constructor(demux()).

• Adder (adder) mixes down at least two buffers into onebuffer. Before addition samples are weighted, channelweights are set using set_input_amp(). Adder supportsdithering and can be a source of signal for dither genera-tor.

• Input le (in le) is used to read data from audio les intoin le’s output buffer. This block uses no input buffer. The-re are three important in le functions: open(), close() andeof(). This block wraps functions provided by libsnd le lib-rary [4].

• Output

le (out

le) is used to write data from a buffer intoan audio le. File format may be speci ed. There are threeeimportant functions: open(), close() and set_format(). out -le autodetects output sample rate and bitdepth. This blockwraps functions provided by libsnd le library [4].

• Dither generator (dither) is a block designed to provi-de dither signal for other blocks. It’s presence is optio-nal.Those nine blocks can be combined to create many diffe-

rent signal processing lines. In the Fig. 5 sample con gurationof stereo-to-mono converter is presented.

also methods for easy access to default input and output lesand wraps calling block’s process() functions in it’s own pro-cess() method.

Con guration le implementing processing line – stereo tomono converter – shown in Fig. 5 is demonstrated on List-ing 1.

Fig. 5. Example of stereo-to-mono converter Rys. 5. Przyk ład konwertera stero do mono

Providing only blocks to build system conFig.d at compile-time is not a exible solution. Building processing line of thosecomponents is easier, but still requires some programmingskills. That is why MAPS provides class for managing buffersand lters.

Class lter_chain can be described as an intelligent con-tainer with dynamically created content. Besides storing obje-cts it is capable of loading signal processing line from a textcon guration le. Con guration le syntax is subset of syntaxsupported by libcon g library [5].

Each con guration le consists of several sections, one ofthem is “con g” section, which describes some parametersof the whole processing line. Other sections describe blocksor buffers, one section each. Properties of a speci c sectiondepend on the type of section, only two things are common:

name and type speci er.Upon loading of such le lter_chain object parses input,

checks for errors (e.g. checks for missing buffers) and createsdynamic structure as described in the le. The class provides

Listing 1. Con guration le implementing stereo-to-mono con-verter Listing 1. Plik kon guracyjny konwertera stero do mono

config: {//config for whole processing linedescription = "stereo to mono converter";default_in = "in"; default_out = "out";in_channels = 2;};

in: { type = "infile";};dmx: { type = "demux";

input = "in";outputs = 2;};adder: { type = "adder"; inputs = ["dmx:0","dmx:1"];

amps = [0x3FFFFFFF,0x3FFFFFFF]; bits = 16;};out: { type = "outfile"; input = "adder";};

Implementation of SSRCThe examples shown above are only a tiny piece of MAPS’scapabilities, as it was created mainly for synchronous samplerate conversion. This process may be performed in severalways. The most simple case is a single step decimator/inter-polator which can be used only if conversion ratio is an inte-ger. If sample rate ratio is rational a cascade of interpolatorand decimator is one of the options. This method is not opti-mal, as the second stage must process audio data at L timesincreased speed. The best solution is to use poly r_ lter classwhich can handle any rational (also integer) ratio using po-lyphase lter approach [7].

Polyphase ltering is an effect of optimizing standard inter-polator-decimator cascade [6]. Combining those two sectionsleads to two LP lters placed between up-sampler and down-sampler, one of them is redundant. While upsampling leadsto processing many zero-valued samples, the down-samplingdiscards some of just calculated. With a little effort a structu-re ommiting multiplying by 0’s and skipping unneeded outputsamples can be developed. This kind of structure is imple-mented in MAPS’s poly r_ lter.

MAPS can be used to implement another commonly usedtechnique – cascading lters in order to decrease compu-tational complexity. This is achieved by lowering transitionband requirements for a single stage, thus reducing total lterlength. MAPS may be therefore used in such cases, but thecon guration le must be modi ed accordingly. Sample con g le describing 44,1 kHz to 96 kHz converter using two casca-ded polyphase lters is presented on Listing 2 .

iSRC – MAPS front-endThe MAPS library has been created as an exible engi-ne. This modular design enabled authors to design simplegraphical user interface without dealing with the internalsof library. Therefore GUI is using MAPS, but as long as the

API is stable, the applications can be developed separately[8].

The iSRC has been written in C++ and uses Qt Toolkit [9].Qt is a framework delivering cross-platform abstraction layerfor many common programming tasks like GUI creation, con-guration storage and thread management.

Page 19: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 19/156

Page 20: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 20/156

ELEKTRONIKA 3/201018

Conclusion

The MAPS library emerged from need for a precise and fastsynchronous sample rate converter. The exibility of the de-sign allowed authors to use it in other DSP tasks. Custom pro-cessing lines can be created using simple con guration les.

In the nearest future further development of both MAPSand iSRC is planned. The schedule includes adding plug-insupport, more blocks (e.g. compandor, noise gate, tone gene-

rator) and a new GUI.Creating a new GUI for MAPS is an additional task and willnot be the top priority, although some design assumptions hasbeen made. The planned features are:• processing line con guration les (*. tr) support,• interactive creation of processing lines using graphical re-

presentation of blocks and links,• real-time alteration of block's parameters,• support for various signal sources.

The results of subjective assessment tests con rm that theimplemented libraty could be the usefull tool for audio signalprocessing. It is hoped that MAPS and iSRC will soon become

well-known brand and will be used by many audio engineersworldwide.

References[1] Stroustrup B.: The C++ Programming Language. Addison-Wes-

ley Pub Co; 3rd edition, 2000.[2] IEEE, IEEE Standard for Floating-Point Arithmetic (IEEE754)

2008.[3] Kostrzewa M., Nykiel P.: In uence of arithmetic error generated in

FIR lters on the quality of audio signals. IEEE Signal processing‘2006, Workshop Proceedings, Pozna ń 29 th September 2006.

[4] Erik de Castro Lopo: libsnd le Manual. Homepage: www.mega-nerd.com/libsnd le/

[5] Mark A. Linder: libcon g Manual. Homepage: www.hyperrealm.com/libcon g/

[6] Roland E.: Crochiere and Lawrence R. Rabiner. Interpolation andDecimation of Digital Signals —- A Tutorial Review, Proceedingsof the IEEE vol 69, 1981.

[7] Kozicki M., Kulka Z.: Simple Audio Synchronous Sampling RateConverter Based on Digital Signal Processor. IEEE Signal Process-ing ‘2004, Workshop Proceedings, Pozna ń 24 th September 2004.

[8] Bielawski B.: Synchronous Sample Rate Converter M.Sc. thesis.Warsaw Uniwesity of Technology, 2009.

[9] Nokia, Qt 4.5 Manual, Homepage: doc.qtsoftware.com/4.5

Human activity recognition (AR) plays an important role inmany of the R&D projects concerning Quality of Life or eHe-alth [1-3]. Not only the amount of movements but also preciseinformation about the movement type are crucial in nowadayscontext-aware computer applications. For example recogni-zing particular activities, such as walking or hands positioning,enables disease symptoms recognition and analysis for Par-kinson’ disease patients [4, 5].

Most popular techniques for AR utilize accelerometer data[6-8]. Modern 3-axis accelerometers, being small and lightelectronic devices [6], allow capturing movement characteri-stics for different body positions [6-8]. The resulting data canbe processed by different classi ers in order to recognize va-rious activities of analyzed subjects. The literature providesan exhaustive description of classi cation techniques used forthat purpose [7-9]. However, most of the authors pay little orno attention to the pre-processing of the accelerometer data.Meanwhile, few available studies on this subjects [10] clearlyindicate the importance of careful selection of the pre-proces-sing techniques in this context.

Pre-processing of the accelerometer data includes: l-tering, selection of time frame and hop lengths, choosing thenumber of feature as well as the number of accelerometersnecessary for successful classi cation. This paper presents

the study of ltering and number of accelerometers in uenceon the AR accuracy.

In the next section a data acquisition protocol is intro-duced. It describes how the data used in experiments wereobtained. Third section presents four classi ers used in thestudy. Those were the k-nearest neighbor classi er withnormal voting (k-NN) and wage voting (k-NN wage), neuralnetwork (NN) classi er, support vector machine classi erand C4.5 decision tree (C4.5) . In the fourth section exper-imental results are presented. They include simulationsinvolving different ltering bands and simulations with va-rious number of accelerometers. Experiments are followedby conclusions.

Data acquisition

It was necessary to capture body acceleration data for thepresented study. The Shimmer platform was used for thistask [11]. Each Shimmer sensor comprises: microprocessor,Bluetooth radio, 3-axis accelerometer and MicroSD card.

Shimmers allow preparing dedicated rmware for speci cpurposes. This approach enables creating own data collec-tion platforms (either by writing own rmware or by modifyingavailable OpenSources).

In uence of accelerometer signal pre-processingand classi cation method on human activity recognition

(Wp ływ przetwarzania wst ępnego i wyboru metody klasy kacjina skuteczno ść rozpoznawania aktywno ści ruchowych)

mgr in ż. ADAM KUPRYJANOW, mgr in ż. KATARZYNA KASZUBA,prof. dr hab. in ż. ANDRZEJ CZY ŻEWSKI

Gda ńsk University of Technology, Multimedia Systems Department, Gda ńsk, Poland

Page 21: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 21/156

ELEKTRONIKA 3/2010 19

Accelerometers positioning used for the data collection

was based on some similar studies available in the literature[12]. Two sensors were placed on the left and on the rightwrists, another two on left and on right ankles, and one sensoron the chest.

Fig.1 depicts sensor positioning as well as their axis po-larization.

All recorded activities were performed by young, heal-thy and right-handed subjects. Average age in the subjectsgroup was 25 years with the standard deviation equalling 2.8years. Activities were performed by 16 people (2 women and14 men). Recordings were made in laboratory conditions, withthe subjects supervised, according to a prede ned list of acti-vities.

Data were recorded on a MicroSD card. The sampling fre-quency of the sensors was set to 51.2 Hz and the range of theallowable acceleration was set to ± 4 g (where g is the gravityacceleration equalling 9.80665 m/s 2). Both values allow recor-ding of typical human body activities.

All accelerometers were synchronized with an external PCclock. Additional video recordings were made during the acce-leration data acquisition in order to capture the information asto how the subjects performed speci c activities.

The prede ned list of activities included:• sitting down on a chair, sitting on a chair, standing up from

a chair;• lying down on a bed, lying on a bed, standing up from

a bed;• walking, climbing stairs, running, standing;• picking an object with one hand, and with two hands.

Activities were repeated three times by each subject. Du-ring the recordings one person produced 20 minutes of ac-celeration data. The entire recording session produced morethan 320 minutes of acceleration data, which corresponds to44 MB of storage data (assuming 12 bit resolution).

Classi ers description

Two distinctive, every-day like activities were chosen for thisstudy. These are: Walking – being a representative of dyna-mic activity, and variety of Hand positioning – representing

a typical static activities. All other activities listed above wereused in the training phase as counter examples, i.e. repre-sentatives of categories No walking and None for hand po-sitioning.

Features necessary to classify different activities werecalculated for overlapping time frames. Frame and hop sizeswere chosen according to the literature [10]: 8 Sa hop sizeand 64 and 32 Sa frames size for walking and hands positionrecognition, respectively.

Features calculated for each time frame consist of time-and spectrum-based characteristics.

Time-domain features

Mean value (1) – the parameter representing the total level ofthe acceleration in the analyzed data frame. Its value is higherfor dynamic activities (e.g. walking) and smaller for static acti-vities (e.g. hand positioning):

(1)

where n is sample number in the acceleration data and N re-presents time frame length.

Standard deviation – depicts the signals variation range:

(2)

The kurtosis was calculated to determine the dynamics of ac-celeration signal:

(3)

where m 4 is the 4th central moment.

The crest factor, i.e. max to RMS value, shows signal im-pulsiveness:

(4)

A relation between different limbs movement can be repre-sented by the correlation coef cients, calculated using acce-leration signals recorded for limbs. In the presented study thecorrelation between corresponding axes of all 5 accelerome-ters were calculated, e.g. right leg X axis vs. left hand X axis(30 combinations in total).

Correlation allows to capture temporary limp positions aswell. Thus in this study the correlations coef cients were cal-culated also between X, Y and Z axes of a particular accelero-meter (15 combinations in total).

The following formula was used to calculate correlationcoef cients:

(5)

where i = 1..5 and j= 1..5 represent accelerometer numberswhereas l={ x, y, z } and m= { x, y, z } accelerometer axes. Corre-lation between different limbs were calculated for i ≠ j and l=m .Correlation between particular accelerometer axes for i=j andl ≠m.

Frequency-domain features

Movement complexity is depicted by the acceleration ener-gy:

∑=

= N

n

na N

a1

)(1 ∑

==

N

n

na N

a1

)(1

( )

−= ∑

=

N

n

ana N

std 1

2)(

11 ( )

−= ∑

=

N

n

ana N

std 1

2)(

11

32

4 −= std

mkrt 32

4 −= std

mkrt

∑=

= N

n

na N

nacf

1

2)(1

))(max(

∑=

= N

n

na N

nacf

1

2)(1

))(max(

)()(),( m

jl i

m j

l i

m j

l im

jl i a std a std

aaaaaacorr

−=

)()(),( m

jl i

m j

l i

m j

l im

jl i a std a std

aaaaaacorr

−=

Fig. 1. Accelerometers positioning and their axis polarizationRys. 1. Rozmieszczenie i polaryzacja akcelerometrów

Page 22: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 22/156

ELEKTRONIKA 3/201020

(6)

where A(k ) is the k -th spectral line of the acceleration signal’samplitude spectrum and K is the total number of lines. In thedescribed experiments K =64 DFT was used.

The movement periodicity can be judged from the accele-ration signal entropy:

(7)

where p (k ) represents the probability of occurrence of A( k ) va-lue in the amplitude spectrum. Small entropy values indicatesignal periodicity.

Due to the number of axes (i.e. 3 for each accelerometer),the number of accelerometers (5) and the number of features,the overall feature vector consists of 135 values (i.e. 15 me-ans, 15 standard deviations, 15 kurtosis, 15 crests factors, 45correlation coef cients, 15 energies and 15 entropies).

NN classi er

As resulted from experiments, it was necessary to design twoNN classi ers: one for walking and the second one for handsposition recognition. Both of them had the same number of in-puts (135), but a different number of hidden layers and outputneurons. In both cases activation functions of hidden layerswere set to sigmoid functions and for the output layer to linearfunctions [13].

The rst classi er – used for walking recognition – hada simpler structure. It is because the Walk and No Walk clas-ses are well-separable. The designed NN architecture hadone hidden layer with 66 neurons and output layer with twoneurons (V shape).

The second classi er had a more complex architecturewith two hidden layers. The rst hidden layer had 66 neurons,whereas the second had 33 neurons. The output layer con-sists of four neurons (V shape).

In both NNs the output neurons corresponded to recogni-zed activities. The error back propagation training algorithmwas used. The same training and testing procedures wereemployed for both NN classi ers. Subsequently, the leave-out-out testing procedure was used.

k-NN classi er

The k-NN classi er is a representative of the ‘lazy classi ers’group, which requires a large set of training examples to givesatisfying results [14]. This classi er calculates the distancesbetween the tested example and all data vectors in the tra-ining set. Then it chooses k results which are closest to thetested example according to some prede ned metrics. TheEuclidean distance was chosen as the metric, de ned as fol-lows:

(8)

where: e represents the investigated case, t is an examplefrom the training set, f indicates feature number.

Then the classi cation result is picked using voting method.In this study two voting methods were tested:

• majority voting – the result is the most frequently appea-ring class

• weighted voting – the result is obtained using the followingformula:

K

k A Eng

K

k ∑

== 1

2)(

K

k A Eng

K

k ∑

== 1

2)(

( )∑=

−= K

k

k pk p Ent 1

2 )(log)( ( )∑=

−= K

k

k pk p Ent 1

2 )(log)(

∑=

−=135

1

2)(),( f

f f euk t et ed ∑

=−=

135

1

2)(),( f

f f euk t et ed

(9)

k value was set to 3, because as it was found empirically, itbrings the most accurate classi cation results for both majori-ty and weighted voting.

For the k-NN classi er it is essential that features used forthe classi cation are normalized. Otherwise features with gre-

ater values are more in uential on the classi cation results.Furthermore, it is crucial to use only those parameters ensu-ring a good separation of analyzed activities.

Support vector machine

Support vector machine approach required building two se-parate classi cation models. Producing a model for Walk, NoWalk classes was a simple task since distinguishing betweentwo classes is a basic capability of a SVM classi er. On theother hand, recognizing hand positions was a more complexissue. For each two classes a distinct sub-model was produ-ced. This resulted in six sub-models which were then combi-ned into one classi er.

The input vector for forming models consisted of 135 fe-atures, however building SVM algorithm excluded some ofparameters e.g. crest factor, entropy in a nal classi cationstructure.

Furthermore, to achieve optimal classi cation rate a pro-per kernel had to be chosen. Two SVM kernels were exami-ned: polynomial and RBF. Since a large amount of data wascomputed, the RBF kernel was not able to successfully builda SVM structure.

C4.5 Decision Tree

For C4.5 decision tree method two distinct tree structureswere grown. In this approach a pruning method of growinga tree was examined. The pruned model avoids situation inwhich the same decision is made more than one time and itrequires less computation memory.

In case of Walk, No Walk classes a three layer multiplysplit tree was built. The method used only energy and stan-dard deviation features to produce optimal classi cation.

For hand position classi cation building the model on tra-ining data results in a ve layer structure. All features appea-red in a tree structure.

Experiments

This section presents experiments investigating in uence ofthe accelerometer signals pre-processing on the AR accuracy.The pre-processing routines included: signal ltering and ad-

justing number of accelerometers. The classi cation accuracywas assessed according to the assumption that speci city ismore important than sensitivity. This means that the propor-tion of negatives which were correctly identi ed, i.e. No Walk examples recognized correctly, was decisive during the clas-siers comparison.

Filtering

Filtering of acceleration signals may improve AR accuracy.Especially the low-pass ltering (LPF), which removes redun-dant information connected to involuntary human movements(e.g. tremor), allows for a better classi cation. In this study two

different LPF cut-off frequency ( f cut) values were examined:6 Hz corresponding to the typical frequency range coveringmost human activities [7]; and 3 Hz representing the lowestfrequency of a typical tremor [1, 4]. An additional ltering was

∑= 2),(1

t ed votes

euk

∑= 2),(1

t ed votes

euk

Page 23: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 23/156

ELEKTRONIKA 3/2010 21

applied in the range of <0.5, 3 Hz> for recognizing of walking.That was because of the fact, that the typical gait is depictedby frequencies starting from 0.6 Hz [7]. An additional scenario

– involving only lowest frequencies – was studied for handpositions recognition for NN and k-NN classi ers. It was inclu-ded in order to examine the classi cation accuracy using onlythe DC component (a technique frequently postulated in theliterature [7-9]). Classi cation results (i.e. confusion matrixes)obtained for different activities with various ltering bands are

given in Tables 1 to 10 .

Tabl. 1. NN walking AR results for different f cut valuesTab. 1. Wyniki rozpoznawania chodu dla klasy katora NN dla ró żnychcz ęstotliwo ści f cut

f cut 0-6 Hz 0-3 Hz 0.5-3 Hz

Act. Walk No Walk No Walk No

Walk 99.55 0.45 99.80 0.20 98.79 1.21

No 0.01 99.99 0.04 99.96 0.17 99.83

Tabl. 2. k-NN walking AR results for different f cut valuesTab. 2. Wyniki rozpoznawania chodu dla klasy katora k-NN dla ró ż-nych cz ęstotliwo ści f cut

f cut 0-6 Hz 0-3 Hz 0.5-3 Hz

Act. Walk No Walk No Walk No

Walk 99.64 0.36 99.64 0.36 60.60 39.40

No 1.42 98.58 1.39 98.61 9.66 90.34

Tabl. 3. k-NN wage walking AR results for different f cut valuesTab. 3. Wyniki rozpoznawania chodu dla klasy katora k-NN z g łoso-wanie wa żonym dla ró żnych cz ęstotliwo ści f cut

f cut 0-6 Hz 0-3 Hz 0.5-3 Hz

Act. Walk No Walk Act. Walk No

Walk 98,58 1,42 98,61 1,39 90,34 9,66

No 0,36 99,64 0,36 99,64 39,40 60,60

Tabl. 4. SVM walking AR results for different f cut valuesTab. 4. Wyniki rozpoznawania chodu dla klasy katora SVM dla ró ż-nych cz ęstotliwo ści odci ęcia f cut

f cut 0-6 Hz 0-3 Hz 0.5-3 Hz

Act. Walk No Walk Act. Walk No

Walk 100,00 0,00 100,00 0,00 99,99 0,01

No 0,12 99,88 0,23 99,77 0,92 99,08

Tabl. 5. C4.5 walking AR results for different f cut valuesTab. 5. Wyniki rozpoznawania chodu dla klasy katora C4.5 dla ró ż-nych cz ęstotliwo ści odci ęcia f cut

f cut 0-6 Hz 0-3 Hz 0.5-3 Hz

Act. Walk No Walk Act. Walk No

Walk 99,93 0,07 99,93 0,07 98,53 1,47

No 1,70 98,30 0,28 99,72 0,22 99,78

In all cases the highest accuracy (in terms of both sensiti-vity and speci city) was achieved for the acceleration signalslow-pass ltered with the f cut=3 Hz and 6 Hz. This indicatesthat the information stored in the frequencies above 3 Hz doesnot play an important role in recognizing of walking. A signi -cant accuracy decrease for the k-NN classi er with the ltering

band <0.5, 3 Hz>, not re ected in others classi ers results,indicates that the DC component can play an important rolefor some classi ers.

Tabl. 6. NN hands position AR results for different f cut

Tab. 6. Wyniki rozpoznawania pozycji r ą k dla klasy katora NN przyróżnych cz ęstotliwo ściach f cut

f cut Act. Left Right Both None

0-6 Hz

Left 99.55 0.00 0.00 0.45Right 0.00 95.55 1.52 2.92

Both 0.48 6.67 84.35 8.51

None 0.01 0.28 0.64 99.07

0-3 Hz

Left 99.31 0.00 0.00 0.69

Right 0.00 97.17 0.00 2.83

Both 6.98 0.90 81.35 10.76

None 0.24 0.21 0.64 98.91

0-0.5 Hz

Left 96.63 0.28 0.20 2.89

Right 0.00 93.02 0.57 6.41

Both 1.72 6.41 83.43 8.44

None 0.18 1.14 0.51 98.17

Tabl. 7. k-NN hands position AR results for different f cut

Tab. 7. Wyniki rozpoznawania pozycji r ą k dla klasy katora k-NN przyróżnych cz ęstotliwo ściach f cut

f cut Act. Left Right Both None

0-6 Hz

Left 84.12 0.16 1.14 14.59

Right 0.63 76.63 1.80 20.94

Both 2.58 3.15 66.44 27.83

None 0.07 0.11 0.47 99.35

0-3 Hz

Left 62.26 0.52 2.78 34.45Right 1.07 54.08 3.14 41.72

Both 4.70 2.98 55.37 36.95

None 0.34 0.16 0.77 98.74

0-0.5 Hz

Left 32.48 2.13 4.76 60.63

Right 4.64 25.56 3.75 66.05

Both 3.92 2.67 24.41 69.00

None 2.12 1.58 2.57 93.74

Tabl. 8. k-NN wage voting hand position AR results for different f cut

valuesTab. 8. Wyniki rozpoznawania pozycji r ą k dla klasy katora k-NN z g ło-sowanie wa żonym przy ró żnych cz ęstotliwo ściach f cut

f cut Act. Both Left None Right

0-6 Hz

Both 65,28 2,72 28,48 3,51

Leftt 0,79 84,32 14,74 0,16

None 0,46 0,07 99,36 0,11

Right 1,01 0,25 21,47 77,27

0-3 Hz

Both 52,73 5,32 38,11 3,84

Leftt 1,54 62,80 35,03 0,63

None 0,67 0,32 98,82 0,19

Right 1,93 0,67 42,69 54,70

0.5-3 Hz

Both 22,43 4,83 70,07 2,67

Leftt 4,44 32,42 60,91 2,24

None 2,47 2,06 93,84 1,63

Right 3,56 3,67 66,26 26,52

Page 24: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 24/156

ELEKTRONIKA 3/201022

Tabl. 9. SVM hand position AR results for different f cut

Tab. 9. Wyniki rozpoznawania pozycji r ą k dla klasy katora SVM przyróżnych cz ę stotliwo ś ciach f cut

f cut Act. Both Left None Right

0-6 Hz

Both 92,25 0,00 5,01 2,74

Leftt 0,00 99,84 0,16 0,00

None 0,38 0,12 97,87 1,63

Right 0,00 0,00 2,86 97,14

0-3 Hz

Both 94,49 0,17 4,83 0,51

Leftt 0,00 100,00 0,00 0,00

None 0,47 0,36 97,37 1,81

Right 0,00 0,00 1,86 98,14

0.5-3 Hz

Both 91,63 0,23 7,97 0,17

Leftt 0,19 99,63 0,19 0,00

None 0,69 0,15 97,82 1,34

Right 0,13 0,00 2,10 97,77

Tabl. 10. C4.5 hands position AR results for different f cut

Tab. 10. Wyniki rozpoznawania pozycji r ą k dla klasy katora C4.5 przyróżnych cz ę stotliwo ś ciach f cut

f cut Act. Both Left None Right

0-6 Hz

Both 85,40 0,11 6,14 8,35

Leftt 6,51 86,67 6,83 0,00

None 1,43 0,00 98,35 0,22

Right 0,00 0,00 18,05 81,95

0-3 Hz

Both 83,63 0,00 7,77 8,59

Leftt 6,67 86,67 6,67 0,00

None 1,18 0,02 98,62 0,17

Right 0,50 0,00 15,15 84,35

0.5-3 Hz

Both 83,90 0,00 8,92 7,17

Leftt 0,00 92,90 7,10 0,00

None 0,72 0,00 99,05 0,23

Right 0,25 0,00 6,94 92,80

For all classi ers except k-NN and k-NN weighted signi -cant stability in results for different LPF was observed. A slightdecrease of ef ciency observed for f cut = 0,5Hz in SVM clas-sier and comparable results for all frequency bands in NNindicates that the most relevant information is stored in DCcomponents.

The k-NN classi er is more pre-processing dependent.Here accuracy decreases substantially with the f cut . It maybe that small accuracies are caused by the frequency-basedfeatures (i.e. entropy, energy, kurtosis). After ltering-out thehigher frequencies, those features decrease separation ef -ciency of sets representing the Left , Right , Both and Nonecategories. This is because the values of frequency-basedfeatures are similar for all of those categories. Even applyingdifferent voting method does not improve classi cation accu-racy.

A perceivable increase in accuracy for a frequency band

0,5Hz-3Hz was observed for C4.5 decision tree. As its struc-ture is mainly dependent on energy and standard deviationparameters, this fact implies that information from a DCcomponent is not processed correctly for this classi er.

Number of accelerometers

As it looks from the results given in section 4.1 it follows thattwo algorithms with best results were SVM and NN classi-ers. Therefore, only the those were chosen to study theinuence of accelerometers number on the classi cation ac-curacy.

Tables. 11-12 depicts the walking AR accuracy dependen-ce on the accelerometers number. The 3 Hz LPF was used

prior to the accelerometers number reduction, because it al-lows for most accurate walking recognition (see section 4.1).The following combinations of accelerometers were examinedduring the study:• 5 – including signals from all sensors (see Fig. 1 ),• 3 – removing signals from sensors placed on wrists,• 2 – removing signals from sensors placed on wrists and on

a chest.The SVM classi er results in satisfying accuracy- close to

100% for the Walk class, however for the No Walk catego-ry a slight decrease in ef ciency can be observed when twosensors were used. Despite this fact the accuracy was above99,6%, which indicates that a satisfying level of classi ca-

tion can be achieved even using only two accelerometers.However, the optimal option was still to use three sensorsas some crucial information was stored in a chest-placed ac-celerometer.

The NN classi er ensured higher accuracies for the Nowalk category regardless of the number of accelerometers.Walk classi cation was more dependent on the number ofaccelerometers. Nonetheless, even when their number wasreduced to two, accuracy was still higher than 99%. This indi-cates that using only two accelerometers should be suf cientfor a successful walking recognition.

Tabl. 11. SVM walking AR results involving different number of ac-celerometers

Tab. 11. Wyniki klasy kacji chodu klasy katorem SVM dla 5,3 oraz 2akcelerometrów

Acc. No 5 3 2

Act. Walk No Walk No Walk No

Walk 100,00 0,00 100,00 0,00 99,94 0,06

No 0,23 99,77 0,20 99,80 0,34 99,66

Tabl. 12. NN wal king AR results involving different number of acce-lerometers

Tab. 12. Wyniki klasy kacji chodu klasy katorem NN dla 5,3 oraz 2

akcelerometrów

Acc. No 5 3 2

Act. Walk No Walk No Walk No

Walk 99.80 0.20 99.56 0.44 99.27 0.73

No 0.04 99.96 0.06 99.94 0.07 99.93

A similar experiment was performed for the hand posi-tions classi ers. Acceleration signals were LPF with thef cut =0.5 Hz for NN classi er and frequency band 0-3 Hz forSVM classi er. However, sensors number reduction was dif-ferent:

• 5 – including signals from all sensors (see Fig. 1 ),• 3 – removing signals from sensors placed on ankles,• 2 – removing signals from sensors placed on ankles and

on a chest.

Page 25: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 25/156

ELEKTRONIKA 3/2010 23

Results obtained for the hands position classi cation arepresented in Tabl. 13-14 . It can be seen from the table thatthe highest overall accuracy was achieved when the numberof sensors was reduced to three. As for the signals recordedon ankles, they did not introduce any useful information. Inall three accelerometer con gurations, lowest accuracieswere achieved for the Both hand position category. It remainsuncertain, as to whether that was caused by the involuntaryhands movements occurring for the None category (this cate-

gory was most frequently confused with others).

Tabl. 13. NN hands position AR results involving different number ofaccelerometersTab. 13. Wyniki klasy kacji pozycji r ą k klasy katorem NN dla 5,3 oraz2 akcelerometrów

Acc. No Act. Left Right Both None

5

Left 96.63 0.28 0.20 2.89

Right 0.00 93.02 0.57 6.41

Both 1.72 6.41 83.43 8.44

None 0.18 1.14 0.51 98.17

3

Left 98.80 0.09 0.00 1.11

Right 0.00 95.76 0.47 3.77

Both 0.00 5.04 84.38 10.57

None 0.04 0.37 0.60 98.99

2

Left 98.65 0.00 0.00 1.35

Right 0.00 96.30 0.00 3.70

Both 0.57 5.73 74.99 18.71

None 0.32 0.76 0.85 98.08

Tabl. 14. SVM hands position AR results involving different number ofaccelerometersTab. 14. Wyniki klasy kacji pozycji r ą k klasy katorem NN dla 5,3 oraz2 akcelerometrów

Acc. No Act. Both Left None Right

5

Both 94,49 0,17 4,83 0,51

Leftt 0,00 100,00 0,00 0,00

None 0,47 0,36 97,37 1,81

Right 0,00 0,00 1,86 98,14

3

Both 95,56 0,00 3,07 1,37

Leftt 0,00 100,00 0,00 0,00

None 0,36 0,03 98,27 1,35

Right 0,00 0,00 2,42 97,58

2

Both 89,29 0,00 10,71 0,00

Leftt 0,00 93,25 6,75 0,00

None 0,23 0,00 99,60 0,17

Right 0,00 0,00 0,52 99,48

Conclusions

The results presented in this paper (mostly in sections 4.1and 4.2) show that pre-processing of the acceleration sig-nal in uences the activity recognition accuracy. Both the ltering band and the number of accelerometers should

be adjusted prior to the data processing, because some ofthem may not introduce any bene cial information. Moreo-ver, the redundancies can reduce the activity recognitionaccuracy.

The presented experiments proved that even 2 accelero-meters are enough to classify walking with accuracy higherthan 99%, whereas 3 accelerometers are suf cient for recog-nizing hand positions.

As a result of examining four independent classi ers the

highest accuracy method was chosen. Optimal classi cationresults were achieved using the SVM classi er. In further ex-periments these classi ers could be implemented in real-timeactivity recognition application.

The research leading to these results has received fundingfrom the European Community‘s Seventh Framework Program(FP7/2007-2013) under grant agreement N°215952 entitled:„PERFORM”.

References

[1] Baga D., Fotiadis D. I., Konitsiotis S., et.all.: PERFORM: Per-sonalised Disease Management for Chronic Neurodegenera-tive Diseases: The Parkinson’s Disease and Amyotrophic lateralSclerosis Cases. eChallenges e-2009 Conference, 21-23 Octo-ber 2009, Istanbul, Turkey (in press).

[2] Aminian K., Naja B.: Capturing human motion using body- xedsensors: outdoor measurement and clinical applications. Com-puter Animation and Virtual Worlds 15, pp. 79-94, 2004.

[3] Lee S. W., Mase K.: Activity and Location Recognitions UsingWearable Sensors. Pervasive Computing July-September, pp.24-32, 2002.

[4] Greenlaw R., Robledo M. G., Estrada J. J., et.all.: PERFORM:Building and mining electronic records of neurological patientsbeing monitored in the home, World Congress on Medical Phys-ics and Biomedical Engineering, 7-12 September 2009, Munich,Germany (in press).

[5] Maziewski P., Suchomski P., Kostek B., Czy żewski A.: An In-tuitive Graphical User Interface for the Parkinson’s Disease Pa-tients, Proceedings of the 4th International IEEE EMBS Confer-ence on Neural Engineering, April 29 – May 2, 2009, Antalya,Turkey.

[6] Mathie M. J., Coster A. C. F., Lovell N. H., Celler B. G.: Accel-erometry: providing an integrated, practical method for long-term, ambulatory monitoring of human movement. Physiologicalmeasurement 25, pp. R1-R20, 2004.

[7] Godfrey A., Conway R., Meagher D., OLaighin G.: Direct Meas-urement of Human Movement by Accelerometry, Medical Engi-neering & Physics 30, pp. 1364-1386, 2008.

[8] Bao L., Intille S. S.: Activity Recognition from User-Annotated Acceleration Data. PERVASIVE 2004, LNCS 3001, pp. 1–17,2004.

[9] Ravi N., Dandekar N., Mysore P., Littman M.: Activity Recogni-tion from Accelerometer Data. Proceedings of the SeventeenthConference on Innovative Applications of Arti cial Intelligence(IAAI-05), pp. 1541-1546, 2005.

[10] Huynh T., Schiele B.: Analyzing Features for Activity Recognition.Joint sOc-EUSAI Conference, Grenoble, October 2005.

[11] Shimmer: Sensing Health with Intelligence Modularity, Mobilityand Experimental Reusability. RealTime Technologies Manual,September 2008.

[12] Lombriser C., Bharatula N., Troste G., Roggen D.: On-body ac-tivity recognition in a dynamic sensor netowork. Proceedings ofthe ICST 2nd International Conference on Body Area Networks,

Article No. 17, Florence, Italy, 2007.[13] Engelbrecht A. P.: Computational Intelligence. John Willey &

Sons, West Sussex, 2007.[14] Larose D. T.: Discovering Knowledge in Data. An Introduction to

DATA MINING. John Willey & Sons, London, 2005.

Page 26: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 26/156

ELEKTRONIKA 3/201024

In many applications it is necessary to modify sound signal bystretching or shrinking it in the time-domain. Time scale mo-dication (TSM) is often used in radio and television to adjustthe time of a program to the available on-air time. For examplewhen the duration of the TV interview is 40 s and it has to bepresented in 35 s, lectors speech should be shrunk [4]. Otherapplication of TSM algorithms is in the audio books. Time ofthe lector speech is modi ed according to users preferences

[9]. As it was shown in literature [9] time stretching has a bene-cial in uence on speech understanding for children with hea-ring impairments. It is possible to improve speech recognitionusing complex speech signal processing, such as changingthe level of sound in various frequency bands and slowingdown the speed of speech in the real-time.

Experiments presented in this paper were carried out inorder to nd the best algorithm that will allow to stretch spe-ech signal in real-time with a low complexity of calculation.This algorithm should be implementable on a DSP processorintegrated with the hearing aid. Such device will be dedicatedmainly to schoolchildren with hearing impairment, especiallyin cases of diminished time-resolution of the hearing sense.

To stretch speech in real-time it is necessary to nd in thespeech signal silent intervals. Those intervals are de ned asperiods of time when in the processed speech signal there isno useful information, e.g. a person who speaks to the chil-dren makes a break, repeats the statement or repeats somewords. The selected TSM algorithm should cooperate with thealgorithm that analyzes speech signal and determines silentintervals. Time-stretching should be performed only for usefulsignal and should remove speech redundancy. The idea ofreal-time speech stretching is shown in Fig. 1 .

Time-domain TSM algorithms

The time-domain TSM techniques provide low complexmethods. Because of that they could be useful in real-timeapplications. All TSM algorithms consist of two parts: analysisstep and synthesis step.

In the analysis step the sound signal is divided into over-lapping frames with a constant length. The overlapping valueis called the analysis time shift.

The synthesis task aim is to reconnect the frames thatwere time-shifted according to the synthesis time shift α. Thesynthesis time shift depends on the time scale factor. The re-lation between analysis time shift and synthesis time shift isde ned as [12]:

(1)

where: Ts – synthesis time shift, Ta – analysis time shift,α – scale factor.

TaTs = α TaTs = α

Real-time speech stretching for supporting hearingimpaired schoolchildren

(Spowalnianie mowy w czasie rzeczywistym w celu poprawy rozumieniamowy przez dzieci szkolne)

mgr in ż. ADAM KUPRYJANOW, prof. dr hab. in ż. ANDRZEJ CZY ŻEWSKIGda ńsk University of Technology, Faculty of Electronics, Telecommunications and Informatics

If the α factor is higher than 1 then the output signal will beextended, if the α factor is smaller than 1 then output signalwill be shortened.

Fig. 1. Idea of real-time speech stretchingRys. 1. Idea spowalniania mowy w czasie rzeczywistym

Original speech

Speech stretched in a real-time

Silence

Differences between TSM methods come from differentapproaches to determining the point of connection betweentwo successive frames in the synthesis phase [1, 2, 11].

Overlap and Add

The overlap and add (OLA) method is the precursor of nearlyall TSM algorithms. The OLA algorithm does not analyze thecontent of the input signal, so it means that points of framesconnection are constant, representing the beginnings of thetime-shifted synthesis frames. Overlapping intervals are calcu-lated as a mix of two frames. The rst frame is faded-out andthe second is faded-in in the overlapping period. Fig. 2 presents

process scheme of signal stretching using the OLA algorithm.Because of the constant point of synthesis frames connec-

tion, the OLA stretched signal contains unpleasant distortionstriggered by the phase and time discontinuities.

Page 27: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 27/156

ELEKTRONIKA 3/2010 25

Synchronous Overlap and Add

Synchronous overlap and add (SOLA) algorithm is a modi ca-tion of the OLA method. It was designed to avoid time discon-tinuities appearing while connecting OLA synthesis frames. Incase of SOLA points of frames connections are not constant.They are determined by the maximum of the cross-correla-tion function calculated between two successive overlappingsynthesis frames [3, 6, 8].

Figures 3 presents the scheme of the signal processingperformed by the SOLA algorithm.

One can notice that rst two steps of the SOLA algorithmare similar to OLA. Calculation of the cross-correlation fun-ction between two overlapped signal intervals is the new step.The cross-correlation maximum determines the time offsetthat has to be added to the synthesis time shift in order toavoid time discontinuities. The last step (i.e. synthesis) is thesame as in the OLA method.

Owing to the connection point improvements the SOLAoutput signal, resulting sounds are more natural. The frameconnections are no longer noticeable.

A variable ratio of speech stretching is considered asa disadvantage of this method. This is caused by the variab-le overlap size. To guarantee the signals are time-stretchedto the factor no less than the de ned scale factor, the cross-correlation maximum could be searched only locally – in thefunction’s positive domain. However, such a modi cation co-uld decrease quality of the output sound.

Time-Frequency TSM algorithm

The second group of TSM algorithms is based on the Phase-Vocoder technique [5]. In this section only one representative ofthis group will be described, i.e. the time-frequency algorithm.

The idea of the Phase-Vocoder TSM algorithm is shownin Fig 4.

In the algorithm’s analysis step the input signal is divided

into overlapping time frames, scaled by tempering windows(e.g. Hanning). As all signal modi cations are made in the fre-quency domain, for each signal frame the DFT is calculated.To preserve the instantaneous frequencies for each frequencyline in the overlapping interval, new phase values are deter-mined according to the formula:

(2)

where: n = {1,2,…, N } and φ (n)ni – is the new frame phase,φ (n)i – is the old frame phase, ∆φ (n) – is the parameter relatedto the changes of φ (n)i , α – is the scale factor.

The synthesis frames are calculated using IDFT of thephase-corrected analysis frames. The stretched signal is ob-tained by adding to the processed signal frames a new timeshift interval.

α )()()( nnn ini ∆+= α )()()( nnn ini ∆+=

Fig. 2. OLA algorithm schemeRys. 2. Schemat przedstawiaj ą cy algorytm OLA

Stretched signal

Overalapinerval

Overalapinerval

Synthesis step

Synthesis block length

Synthesis time schift

Overalapinerval

Original signal

Analysis step

Analysis block length

Analysis timeschift

Syntesis step

Analysis step

Analysis block length

Analysis timeschift

Synthesis time schift Overalapinervaloffset

offset

Cross-correlation function

Stretched signal

Synthesis time schift

Overalapinerval

Synthesis time schift

Overalapinerval

offset

Original signal

Fig. 3. SOLA algorithm schemeRys. 3. Schemat przedstawiaj ą cy algorytm SOLA

Page 28: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 28/156

ELEKTRONIKA 3/201026

Spectral consistency measureTime-stretching quality could be measure using metric pro-posed by J. Laroche in [7] and used in practice as describedin literature [10]. This metric describes the distance betweenthe spectrum of the original signal x[n] and spectrum of thestretched signal y[n] . It could be expressed as:

(3)

where: Dm – spectral consistency measure, X (Ta u, ω k ) – STFTfrom the one frame of input signal x(n), Y (α Ta u, ω k ) – STFTfrom the one frame of the stretched signal y(n), u – numberof the frame, P – number of the rst and last frame that areexcluded to avoid errors due to missing overlapped segments,Ta u – analysis time shift of the u frame, α – scale factor.

Usually Dm is expressed in dB. As this value becomesmore negative, the distance between spectrum of the originalsignal and the spectrum of the stretched signal decreases, sothe quality of the stretched signal increases.

∑ ∑∑ ∑

−−

=

=

−−

=

=−

= 1 1

0

2

1 1

0

2

|),(|

|]),(||),([|

P U

P u

N

k k u

P U

P u

N

k k uk u

Ta X

Ta X TaY Dm

ω

ωωα

∑ ∑∑ ∑

−−

=

=

−−

=

=−

= 1 1

0

2

1 1

0

2

|),(|

|]),(||),([|

P U

P u

N

k k u

P U

P u

N

k k uk u

Ta X

Ta X TaY Dm

ω

ωωα

Experiments

Algorithms that were presented early were implemented inMatlab. Two variations of SOLA algorithm were prepared:SOLA1 – that keeps constant stretch factor and SOLA2 – thathas a variable stretch factor.

To test which algorithm ful ls the de ned requirements,i.e.: real-time signal processing, high quality output signal andlow complexity of calculations, a speech signal was proces-

sed using all of them with the different frame length and timeshift periods.In all tests the time necessary to process the signal was

measured. The input signal was male speech, 20.436 s long.If the time of signal processing is signi cantly longer than theinput signal duration, it indicates that the tested algorithm isnot suited for the real-time processing. In the experiments thescale factor for all algorithms was set to 2. The frame lengthvalues were set to: 1024, 2048, and 4092 Sa. The frame timeshift was set to 25% of the frame length.

To assess the time stretching quality a subjective testsession was carried-out. 9 persons were involved in the test.Each expert had to assess the quality of the processed sig-

nals. He or she had to take into account such characteristicsas: speech naturalness and level of distortions. The qualitywas assessed in the scale from 1 to 5:• 1 – very poor,• 2 – poor,• 3 – suf cient,• 4 – good,• 5 – very good.

To verify results obtained from the subjective tests Dmmeasure was calculated for all stretched signals.

In Tabs 1 to 3 the processing time, quality assessmentsand Dm measure for different frame and hop sizes are given.The Quality was calculated as the median value among allexperts scores.

Tabl. 1. Rocessing time, quality assessment and Dm measure ob-tained for speech processed with TSM algorithms (frame size 1024Sa, hop size 256 Sa)Tab. 1. Czas przetwarzania sygna łu mowy, ocena jako ści przetwo-rzonego sygna łu oraz wspó łczynnik Dm uzyskane dla ró żnych algo-rytmów mody kacji czasu trwania mowy (d ługo ść ramki 1024 próbki,zak ładka 256 próbek)

Algorithm name Time [s] Quality Dm[dB]

OLA 24.19 2 -4.84

SOLA 1 40.50 2 -13.01

SOLA 2 21.85 5 -17.96

Phase-Vocoder 2.15 3 -9.02

Among the tested algorithms the Phase-Vocoder provedto be the fastest. It received low but consistent quality assess-ments (mark 3) independently of the frame and hop sizes.Dm measure for this algorithm has low values (from -9.02 to-6.48 dB) which con rmed the results of the quality assess-ment. Because of the poor subjective quality of its output thePhase-Vocoder algorithm should only be used in cases whenthe very low processing complexity is needed.

The highest quality of the stretched signal was obtained for

the SOLA 2 algorithm. However, in this case not every frameand hop lengths allow for real time processing. Only frames of2048 Sa and 4092 Sa can be used in real-time SOLA2 algo-rithm. Among those two the higher quality was obtained for the

Fig. 4. Phase-Vocoder TSM algorithm schemeRys. 4. Schemat przedstawiaj ą cy algorytm wokodera fazowego

Syntesis step

Signal frames phase modification

Stretched signal

Overalapinerval

Overalapinerval

Synthesis block length

Synthesis time schift

Overalapinerval

Analysis s tep

Analysi s block length

Original signal

Analysi s timeschift

IFFT

FFT

Page 29: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 29/156

ELEKTRONIKA 3/2010 27

2048 Sa frame length. Dm measure for this algorithm showedthat stretched signal spectrum is highly similar to the originalspeech (from -17.96 dB to -14.05 dB).

Tabl. 2. Processing time, quality assessment and Dm measure ob-tained for speech processed with TSM algorithms (frame size 2048Sa, hop size 512)Tab. 2. Czas przetwarzania sygna łu mowy, ocena jako ści przetwo-rzonego sygna łu oraz wspó łczynnik Dm uzyskane dla ró żnych algo-

rytmów mody kacji czasu trwania mowy (d ługo ść ramki 2048 próbki,zak ładka 512 próbek)

Algorithm name Time [sec] Quality Dm[dB]

OLA 12.08 2 -4.84

SOLA 1 21.62 1 -15.38

SOLA 2 10.72 5 -14.7

Phase-Vocoder 2.04 3 -8.22

Tabl. 3. Processing time, quality assessment and Dm measure ob-tained for speech processed with TSM algorithms (frame size 4092Sa, hop size 1024 Sa)

Tab. 3. Czas przetwarzania sygna łu mowy, ocena jako ści przetwor-zonego sygna łu oraz wspó łczynnik Dm uzyskane dla ró żnych algo-rytmów mody kacji czasu trwania mowy (d ługo ść ramki 4092 próbki,zak ładka 1024 próbek)

Algorithm name Time [sec] Quality Dm[dB]

OLA 6.11 3 -4.51

SOLA 1 10.83 1 -12.7

SOLA 2 5.44 4 -14.05

Phase-Vocoder 2.32 3 -6.48

Conclusions

As it was shown in the experimental part of this paper, theSOLA2 algorithm can be considered for enhancement ofspeech understanding in case of diminished time-resolution

hearing impairment. That is because of its low complexityand high quality of the processed signal. The SOLA methodcan work in the real-time on a DSP processor and it canstretch the input signal with a factor of real continued va-lues.

Research funded within the project No. POIG.01.03.01-22-017/08,entitled “Elaboration of a series of multimodal interfaces andtheir implementation to educational, medical, security and in-

dustrial applications”. The project is subsidized by the Euro-pean regional development fund of the and by the Polish Statebudget”

References

[1] Demol M., Verhelst W., Struyve K.: Ef cient Non-Uniform Time-Scaling of Speech with WSOLA. 2005.

[2] Dorran D., Lawlor R., Coyle E.: High quality time-scale modi ca-tion of speech using a peak alignment overlap-add alogroithm(PAOLA). 2003.

[3] Ergoul O., Karagoz I.: Time-scale modi cation of speech signalsfor language-learning impaired children. 1997.

[4] Gro t S., Lavner Y.: Time-Scale Modi cation of Audio SignalsUsing Enhanced WSOLA With Management of Transients. IEEETrans. On audio, speech, and language processing, vol. 16, no.1, Jan. 2008.

[5] Karrer T., Lee E., Borchers J.: PhaVoRIT: A Phase Vocoder forReal-Time Interactive Time-Stretching, 2006.

[6] Ke L., Jia L.: SOLA based on Zero-Crossing Point. IMACS, pp.110-112, Beijing, China, Oct. 2006.

[7] Laroche J.: Improved Phase Vocoder Time-Scale Modi cation of Audio. IEEE Trans. On audio, speech, and language processing,vol. 7 no. 3, May 1999.

[8] Maziewski P.: Wst ępne przetwarzanie d źwięku przeznaczonegodo ods łuchu wielokana łowego. Zeszyty naukowe WE PG 2004,vol. 20, str. 115-120.

[9] Nejime Y., Aritsuka T., Imamura T., Ifukube T., Matsushima J.: A portable digital speech-rate converter for hearing impairment.IEEE Trans. Rehabil. Eng., vol. 4, no. 2, pp. 73–83, Jun. 1996.

[10] Pesce F.: Realtime-stretching of speech signals. DAFX, Italy,2000.

[11] Verhelst W., Roelands M.: An overlap-add technique based onwaveform similarity (WSOLA) for high quality time-scale modi -cation of speech. 1993.

[12] Zolzer U.: DAFX Digital Audio Effects. Wiley, 2005.

Page 30: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 30/156

ELEKTRONIKA 3/201028

Application areas of modern power electronics are continu-ously extending e.g. variable speed drives, active lters andpower conditioners, power supplies. New application speci cproduct groups have been rising rapidly: electric vehicles anddedicated chargers, photovoltaic and wind energy supply sy-stems.

Advanced power converter topologies and control algorit-hms [1] require high-speed, programmable and exible har-

dware platform for implementation, rapid prototyping, testingand industrial applications. During the last decade xed- andoating-point DSP familes were the ef cient solutions for real-time control with complex numerical algorithms. Currently eldprogrammable gate arrays (FPGAs) achieve technology gra-de competitive to traditional DSPs. FPGAs offer very high logi-cal capacity, parallel processing possibilities, very high speed,exibility and in-system reprograming features. Today, FPGAsplay an increasing role in a wide range of DSP implementa-tions, especially in power electronics. This trend is expectedto continue over the next several years.

Flexible DSP/FPGA-based control system

architecture conceptThe Gdansk Branch of the Electrotechnical Institute has ma-naged many R&D works on power electronics from the begin-ning of 90 s. The rst DSP/FPGA-based integrated stand-alo-ne control system dedicated for power conversion and motioncontrol application was designed using TMS320F206/C203DSP and FLEX10K FPGA ( Fig. 1, 2 ).

In practice some disadvantages of basic, single proces-sor system architecture ( Fig. 3 ) were observed [2]. They werecaused by rapid technology progress in DSP/FPGA families.The CPU core could not be easy upgraded accordingly.

A exible DSP/FPGA-based hardware platform forpower electronics

(Elastyczna platforma sprz ętowa do aplikacji energoelektronicznychz procesorami DSP i uk ładami programowalnymi FPGA)

mgr in ż. LESZEK D ĘBOWSKIThe Electrotechnical Institute, The Gdansk Branch, Gdansk

Fig. 1. DSP/FPGA-based integrated stand-alone controlsystem DLH-01Rys. 1. Schemat blokowy autonomicznego systemusterowania DLH-01 z elementami DSP/FPGA

Fig. 2. DLH-01 control system prototypeRys. 2. Prototyp systemu sterowania DLH-01

Fig. 3. Basic, single processor sytem architectureRys. 3. Podstawowa, jednoprocesorowa architektura bazowa

The philosophy of the new, improved architecture is ba-sed on a exible system con guration ( Fig. 4 ), which consistsof plug-in central processing unit and dedicated motherboard(Fig. 5, 6 ) designed to meet a wide range of power electronicapplications requirements.

Fig. 4. Flexible control sytem architectureRys. 4. Elastyczna architektura systemu sterowania

Page 31: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 31/156

ELEKTRONIKA 3/2010 29

Scalable computational power of the CPUs meets vario-us requirements of power conversion and motion control al-

gorithms. The suitable DSP/FPGA-based CPU module, e.g.DLH-08 ( Fig. 7 ) can be speci ed or designed depending

on application requirements and programming experiencesof the user. Every CPU boards must be designed to ful l elec-trical and mechanical compatibility with the exible motherbo-ard DLH-02.

Current development trends and new potential applica-tion areas (power quality, electric vehicle, railway tractiondrives) have resulted in redesign of the control system.Boad size reduction aims at increasing EMI performanceand reducing costs. Additionally, DSP application deve-

lopers would like to use easier programming methods in-cluding ef cient C/C++ compilers and graphical modeling/code generation tools instead of time-consuming coding inassembly language.

New family of DSP/FPGA-based CPUs

TMS320F28x family, introduced in 2001 by Texas Instruments,was the rst high-speed (up to 150 MIPS) xed-point DSPcontrollers which 32-bit architecture coupled with C coding to-ols ef ciency useful for power electronics target systems. Tab-le 1 summarizes the basic parameters of the TMS320F281xsub-family.

Fig. 6. Flexible motherboard DLH-02 prototypeRys. 6. Prototyp elastycznej karty bazowej DLH-02

Fig. 5. Block diagram of exible motherboard DLH-02Rys. 5. Schemat blokowy elastycznej karty bazowej DLH-02

Fig. 7. Block diagram of the oating-point CPU DLH-08Rys. 7. Schemat blokowy zmiennoprzecinkowej jednostkicentralnej DLH-08

Tabl. 1. Basic parameters of TMS320F281x sub-familyTab. 1. Podstawowe parametry podrodziny TMS320F281x

The rst member of new CPU family is based on theTMS320F/R2812 DSP (150 MIPS, single cycle 6.67 ns).The structure of the TMS320F2812 includes the followingmajor blocks: internal FLASH memory, internal RAM, bootROM with selectable boot modes and math function tables,16 PWM channels with programmable dead-time genera-tors, 2 incremental encoder interfaces, 12-bit A/D convetrerblock with 2×8-channel input multiplexer and 2 S/H units.The TMS320R2812 has slightly increrased internal RAMand no internal FLASH. In stand-alone operation this pro-cessor must boot the user program from external EEPROM.Except the mentioned DSP controller, the architectureof the CPU module consists of the following components(Fig. 8, 9 ):− external static RAM 128K/256K/512K×16-bit,− processor con guration block,− dual-channel programmable UART,− dual-channel 8/10/12-bit D/A converter,− external EEPROM memory with SPI interface, 32K/64K/

128K×8-bit capacity),− RS-232 (upt to 4), CAN and JTAG interface,− dual voltage regulator as power supply block (1.9 V for pro-

cessor core supply 3.3 V – for I/O subsystem),− external power supply monitoring and supervising circuit

(watch-dog).The main external signals of the plug-in CPU are arranged

into two connectors with standarized pinout topologies:− analog inputs for I/U transducers, control signals for power

devices (PWM) and diagnostic signals (ERROR)− data transmission signals and power supplies.

Page 32: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 32/156

ELEKTRONIKA 3/201030

Cost-sensitive applications and basic-level DSP educationwill be supported by new dedicated Piccolo subfamily. Theselow-cost, low pin-count DSP controllers are compatible withTMS320F28x core and includes oating-point arithmetic ca-pabilites (TMS320F2803x) implemented as control law acce-lerator (CLA) running in parallel with the F28x core. Appropria-te CPU module is also under development.

Future CPU designs will be focused on advanced oa-

ting-point DSPs (TMS320F2833x, Del

no, TMS320C672x,SHARC) and high-speed FPGAs (Cyclone, Stratix, Spartan,Virtex) equipped with extended DSP function block supportand parallel processing capabilites.

Flexible baseboards for power electronicsFlexible baseboard family was designed to be easily ap-

plied for a wide range of power converter topologies:− advanced AC drives, AC/DC/AC converters,− active lters, compensators and power conditioners,− matrix and multilevel converter,− UPS, specialized power supplies and chargers,− traction vehicle and electric car drives,− distributed energy generation systems controllers.

Internal architecture of the exible baseboard consists ofthe following major blocks ( Fig. 11, 12 ):− programmable logic unit based on high-speed CPLD with

the capacity of 570/1270 logical blocks and in-system pro-gramming capability,

− 2 exible interfaces for power inverter control and diagno-stic (6 PWM outputs and 4 diagnostic inputs),

− 12 analog inputs for voltage/current transducers,− 2/4 analog outputs (8/10/12-bit, 0…3 V),− 2 incremental encoder inputs (A, B, INDEX signals),− 2 relay outputs (250 V AC /8 A),− USB and CAN interfaces,− 16/32/64/128 kB serial EEPROM or FLASH memory,− real-time clock (RTC) with battery backup,− power supply and system supervising unit.

Fig. 9. CPU module DLHF2812Rys. 9. Modu ł jednostki centralnej DLHF2812

Modern power electronic applications must include verywell suited control systems. Advanced R&D projects requi-re increasing speed and computing power, but on the otherhand, standard converters with conventional topologies andhigh-volume applications must be equipped with low-costcontrollers. The CPU family must follow on the technologicaltrends.

After detailed analysis, new CPU architectures are pro-posed. The rst concept uses new subfamily of 32-bit DSPcontrollers – TMS320F280x/F280xx. All subfamily membersare pin-to-pin compatible, but with scalable speed, internalmemories and peripherials ( Tabl. 2 ).

Fig. 8. Block diagram of DLHF2812/R2812 CPURys. 8. Schemat blokowy modu łu jednostki centralnej DLHF2812/R2812

Tabl. 2. Basic parameters of F280x/F280xx sub-familyTab. 2. Podstawowe parametry podrodziny F280x/F280xx

Schematic diagram of a new CPU module is presented onFig. 10. Users will specify the controller type depending on the

application requirements. The potential application range isextended: from digital power supplies and chargers to advan-ced motion controllers and power conditioners.This module iscurrently under development.

Fig.10. Schematic diagram of TMS320F280x/280xx CPURys. 10. Schemat blokowy modu łu jednostki centralnej z kontro-lerami DSP TMS320F280x/280xx

Fig. 11. Block diagram of fexible baseboard – standard ver Rys. 11. Schemat blokowy standardowej wersji elastycznej kartybazowej

Page 33: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 33/156

ELEKTRONIKA 3/2010 31

All external digital I/O signals of the baseboard have galva-nical isolation based on high-speed optocouplers (10/15 MHz).Higher switching speed (up to 150 MHz) can be supported bynew generation of isolators with magnetic or capacitive co-upling. Each PWM signal can be supplied from PWM line of

the main processor on CPU board or sourced from CPLD pinon baseboard depending on user selection.

Fig. 12. Flexible baseboard – standard versionRys. 12. Elastyczna karta bazowa – wersja standardowa

Fig. 13. Flexible PWM signal generation blockRys. 13. Elastyczny blok generacji sygna łów PWM

16-bit parallel bus and Serial Peripherial Interfeace (SPI)provides the bidirectional data ow between the processorand CPLD. Analog input channels include optional voltage le-vel shifting and ltering options.

Fig. 14. Parallel 16-bit bus and PWM block connectionRys. 14. Po łą czenie 16-bitowej magistrali równoleg łej z blokiemPWM

Fig.15. Serial (SPI) bus and PWM block connectionRys. 15. Po łą czenie szeregowej magistrali SPI z blokiem PWM

Basic version of the exible baseboard is arranged as

a control system core which can be modi ed to achieve ap-plication speci c options. One of them, equipped with 72-pinangle connector is used in a modular rack-mounting systemdedicated for electric traction drives control and auxiliary sup-ply management ( Fig. 24 ).

Extended version of the baseboard ( Fig. 16, 17 ) was de-signed by including additional blocks (6 PWM outputs and2 diagnostic inputs), components ( bre optic links, voltagetransducers) and connectors on board. Total number of con-trol outputs and diagnostic inputs are increased to 18 PWMand 10 ERROR lines.

Fig. 17. Flexible baseboard – extended versionRys. 17. Elastyczna karta bazowa – wersja rozszerzona

Fig. 16. Block diagram of fexible baseboard – extended ver Rys. 16. Schemat blokowy rozszerzonej wersji elastycznej

karty bazowej

Page 34: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 34/156

ELEKTRONIKA 3/201032

Further development of the exible baseboard family willbe focused on replacing the CPLD by high-speed, high-capa-city FPGA. Total procesing power of the system will be incra-sed signi cantly. Complex signal processing tasks can bedivided beetwen DSP/FPGA-based CPU module and FPGAsignal co-processor on basedboard.

Applications of the exible control system

The architecture of the exible control system can be con gu-red for many power converter structures. It can be successfullyapplied on the research, educational and industrial areas.

Research applications

Supercapacitors ( Fig. 18 ) give new possibilities for electricenergy storage and power conditioning. Industrial systemfaults have been often caused by short-term network voltagedisturbances. It makes possible to replace traditional battery-based UPSs by power conditioners with supercaps.

Fig. 18. High voltage supercapacitor 1 F/400 VRys. 18. Superkondensator wysokonapi ęciowy 1 F/400 V

New equipment can provide fast response and recoverytime with optional active ltering. Maintenance costs can besigni cantly reduced. The Gdansk Branch of the Electrotech-nical Institute has managed the special R&D project of high-voltage (300 V/2.5 F) supercap-based power conditioner. Pro-totype of single-phase version ( Fig . 19, 20 ) was designed andsuccessfully tested. Two exible control systems are used:one system for cascaded phase inverters, second – for bidi-rectional DC/DC conversion control. Target three-phase ver-sion is currently nished.

Fig. 20. Single-phase power conditioner prototypeRys. 20. Prototyp jednofazowego kondycjonera energii

Fig. 19. Schematic diagram of single-phase power conditioner Rys. 19. Schemat wersji jednofazowej kondycjonera energii

Multilevel current inverter structure analysis and control al-gorithm develoment was proposed as a new Ph.D. project. 3-phase outputs of three power inverters are connected directlyin parallel without coupling transformer ( Fig. 21 ). Flexiblecontrol system with extended baseboard is used to manage18 power switches (IGBTs) and rst results are obtained ( Fig.22 ). However, presented con guration has disadvantage aseach inverter requires separate AC supply with galvanic isola-tion (transformer). 3-phase input recti ers will be replaced byone integrated AC/DC power converter with three galvanicallyisolated outputs.

Fig. 22. Experimental setup of multilevel current inverter Rys. 22. Stanowisko eksperymentalne z wielopoziomowymfalownikiem pr ą du

Fig. 21. Schematic diagram of multilevel current inverter Rys. 21. Schemat wielopoziomowego falownika pr ą du

Page 35: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 35/156

Page 36: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 36/156

ELEKTRONIKA 3/201034

Nonlinear distortions are the product of processing a signal byan electronic system with the non-linear input/output charac-teristics. These distortions manifest themselves at the outputwith components that were not present at the input. In case ofthe excitation with a sinusoidal signal, at the non-linear circuitoutput, beside the basic component, some harmonics of that

component appear. Non-linear distortions are bothersome iftheir the percentage content in the signal is signi cant. For thedetermination of the level of non-linear distortions the parame-ter THD (Total Harmonic Distortion) is used, which is a coef-cient specifying the content of harmonics and is expressedwith the formula:

(1)

This is the quotient of the root-mean-square values of harmo-nics and the whole signal. Also a coef cient of the i -th har-monic content is de ned. This coef cient is expressed by theformula:

(2)

where the “ i” usually equals 2 or 3 [1].The coef cients of the harmonic content can be expressed

in percentage or decibels. However, the values expressed bythe THD parameter do not provide satisfactory results and arehardly correlated with a subjective perception [2, 3]. That iswhy detailed investigations aimed to obtain an appropriate tothe highest possible degree measure concerning subjectiveperception are still conducted.

Today, signal processing is carried out almost exclusivelyin digital form [4-8]. That is why we decided to carry out themeasurements of nonlinear distortion in loudspeakers with theuse of digital lters.

In fties Wolf developed a method of exciting the systemby using of a real signal (music) with the narrow frequencyband ltered out [9-11]. At the output the product of non-lineardistortions is measured just within this already cut out freque-ncy band. This method has not been used for many yearsbecause it imposes very speci c, high demands as far as thesteepness of lter lobes are concerned: the band-rejection l-ter at the input and band-pass one at the output.

This article presents the impact of digital lter parameters

on the results of nonlinear distortion measurements in loud-speakers. For the purpose of these measurements the mo-died Wolf method have been applied. The modi cations con-sist in the use of digital lters featured with appropriate steep

%100...

...22

423

22

21

224

23

22

+++++++=

k

k

H H H H H

H H H H THD %100

...

...22

423

22

21

224

23

22

+++++++=

k

k

H H H H H

H H H H THD

%100... 22

322

21 ++

=k

ii

H H H H

H h

%100... 22

322

21 ++

=k

ii

H H H H

H h

The impact of digital lter parameters on the resultsof nonlinear distortion measurementsin loudspeakers – simulation process

(Wp ływ parametrów ltrów cyfrowychna wyniki pomiarów zniekszta łce ń nieliniowych g ło śników – symulacja)

prof. dr hab. in ż. ANDRZEJ DOBRUCKI, mgr in ż. RAFA Ł SICZEK

Wroc ław University of Technology, Institute of Telecommunications, Teleifnormatics and Acoustics

slope and the excitation of the circuit with broad-band noise[12,13]. The measuring block diagram is presented in Fig. 1 .

Fig.1. Measuring circuit with the Wolf methodRys. 1. Schemat pomiarowy metody Wolfa

As excitation signals, both pink and white noise generatedwith sampling frequency 44.1 Hz were used. Measurementsand simulations were carried out with the Matlab program andits tools.

Filters

The important section of this research is an appropriate desig-ning of digital lters with taking the very steep lobes of these lters into consideration. This results from the assumption thatthe residual noise related to the signals processing by ltersand remaining within the system should be signi cantly lowerthan the product of non-linear distortions. The main advan-tage of the digital ltration is that very good parameters offrequency characteristics can be obtained [14]. The attenu-ation levels obtainable in digital lter are much higher thanin the analogue one. The pass band in digital lters is verynarrow and normally without waving. The application of digital ltering in the measuring method will signi cantly increase theaccuracy of measurements. The lters have been designedwith the Filter Design & Analysis Simulink Tool. Designing ofFIR and IIR lters is carried out either by introduction of the lter speci cation or importing lter coef cients from the wor-kspace of the Matlab program, as well as by modi cation ofthe distribution of zeros and poles of the lter transfer function(adding, shifting or removing). The various ways for insertionof lter speci cations are available in the program. The usercan select a lter type and then a designing method accordin-gly for FIR and IIR lter types. The lter order, sampling fre-quency, and cut-off frequencies for pass and rejection bandsare de ned.

Filters have been designed so that the bandwidth of theband-rejection lter at the transmission side was 5/9 of octaveband, and the bandwidth of the band-pass at the receiver side

– 1/3 of the octave band. This is connected with the assump-

Page 37: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 37/156

ELEKTRONIKA 3/2010 35

tion that the residual noise remaining in the circuit should beenough low that not to affect in signi cant degree the mea-surement results. Fig. 2 shows the amplitude characteristicsof an exemplary lter of the mid-band frequency f 0 = 200 Hz,designed with the Fdatool program.

(4)

we obtain a system of nonlinear differential equations of thesecond order which takes into account nonlinearity coef -cients μ 1 and μ2, as well as asymmetries x 01 and x 02 of bothBl -product and suspension stiffness, respectively.

])(1[

])(1[2

0110

20220

x x Bl Bl

x x K K

−−=−+=

µµ

])(1[

])(1[2

0110

20220

x x Bl Bl

x x K K

−−=−+=

µµ

Fig. 2. Designed Butterworth digital lter, n = 30, mid-band fre-quency f 0 = 200 HzRys. 2. Przyk ładowy ltr cyfrowy Butterwortha, n = 30, cz ęstotli-wo ść ś rodkowa f 0 = 200 Hz

Measurement methodThe proposed method of the measurement will be characteri-zed by a new solution consisting in the application of a wide-band noise as the excitation signal and using digital lters ofvery sharp lobes.

A wide-band noise is fed to the system input, and them it is ltered with the band-rejection lter. After the ltering the testsignal is fed to the non-linear block representing a dynamicloudspeaker. After leaving the loudspeaker block the signalis ltered by the digital band-pass lter. In the RMS block theroot-mean-square vale is calculated. This way the product of

the non-linear loudspeaker distortion is obtained. By changingthe mid-frequencies of both lters the relationship of arisendistortions versus frequency can be obtained. The block dia-gram is presented in Fig. 3 .

Fig. 3. Measurement method diagramRys. 3. Schemat blokowy metody pomiarowej

For this study purposes, instead of a real loudspeaker itsmodel resulting from equations (3) and (4) has been used[15]:

(3)

Taking into account the nonlinear dependence of the sus-pension stiffness K and the nonlinearity of force factor Bl onthe displacement x :

i Bl Kxdt dx

Rdt

xd M

dt dx

Bl i Rt E

M

E

=++

+=

2

2

)(

i Bl Kxdt dx

Rdt

xd M

dt dx

Bl i Rt E

M

E

=++

+=

2

2

)(

Fig. 4. Flow chart – loudspeaker modelRys. 4. Graf przep ływowy – model g ło śnika

The mathematical model of the dynamic loudspeaker is desig-ned also in the Simulink software as a ow-graph shown below:

The non-linear elements in the model are the stiffness K ofthe suspensions, and the Bl -product which depend on the de-ection x according to formula (4). Other parameters of the vi-brating and electrical system of the loudspeaker are the massM , mechanical resistance R m, and electrical resistance R e.

On the basis of foregoing equations a ow chart in the Si-mulink program has been designed. The chart shown in willserve us as a model of the dynamic loudspeaker. At the outputof the circuit presented in Fig. 4 we obtain the values of thesound pressure. This is associated with the following relation-ships describing the values of this pressure:

(5)

MeasurementsMeasurements and simulations have been carried out with theuse of Matlab packages: Simulink and Filter Design & Analy-sis Tool. The block diagram of the measurement method fromthe Simulink program is presented in Fig. 5 . The circuit is exci-ted with either white or pink noise of the Sound Pressure Levelvalue SPL = 125 dB.

0 2ak

S p

d a

νωρπ

ων

=

=

0 2ak

S p

d a

νωρπ

ων

=

=

Fig. 5. Measurement method diagram – Simulink programRys. 5. Schemat blokowy metody pomiarowej z programu Simulink

Page 38: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 38/156

ELEKTRONIKA 3/201036

The impact of lter types on measurement resultsWhen carrying out measurements, rst the impact of changingof used lter types on measurement results has been checked.While designing lters with nite impulse response FIR valuesof lter order n=4000 have been obtained. However for IIR l-ters satisfactory results have been obtained at values n=30-50.In spite of signi cant order difference the measurement resultswere very similar. Taking additionally into account the comple-xity of the calculation process and the time needed for creation

models of appropriate FIR lters we decided to use in furthercalculations lters with in nite pulse response.

Fig. 6. Residual noiseRys. 6. Szum resztkowy

Measurement of the residual noiseFigures 6 shows the residual noise, which remains within thesignal after passing through the tested circuit, with the as-sumption that both nonlinear elements of the equation areequal 0. As the excitation signal white and pink noise wasused.

Fig. 7. Nonlinear distortion of the system described by (6):a) A=0, B=1/30000; b) A=0, B=1/3000Rys. 7. Zniekszta łcenia nieliniowe funkcji opisanej zale żno ścią (6):a) A=0, B=1/30000; b) A=0, B=1/3000

Fig. 8. The impact of lter type on measurement resultsRys. 8. Wp ływ rodzaju ltra na wyniki pomiarów

Fig. 10. The impact of lter order on measurement results ( n=30, n=50)Rys. 10. Wp ływ rz ędu ltra na wyniki pomiarów ( n =30, n =50)

Fig. 9. The impact of lter order on measurement results ( n=10, n=20)Rys. 9. Wp ływ rz ędu ltra na wyniki pomiarów ( n =10, n =20)

Residual noise is enough low and does not affect for ourmeasurement results.

Simulink implementation using a simple static non- linearity In order to check the correctness of the measurement pro-cess in the nonlinear block the polynominal function of thirdorder has been applied (6). This function is typical for simu-lation of loudspeaker nonlinearity. The parameters A and Bwere changed in order to investigate their in uence on theproduct of nonlinear distortion. The simulation was lead forfrequencies form 20 to 2000 Hz. The results are presentedin Fig.7 .

(6)32)( Bu Auuu f ++= 32)( Bu Auuu f ++=

The simulations show that the product of nonlinear distor-tion has the higher level when the coef cients of the nonline-arity increase.

Changing lter order

The impact of the lter order on nonlinear distortion measure-ment results has been investigated. The observation have shownthat with the increase of the order value the degree of distor-tions caused by the imperfection at designing digital lters dec-reases ( Fig. 9 and 10 ). For lters of order greater than 50 thesedifferences are practically imperceptible and they do not affectsigni cantly measurement results. Measurements have been

Page 39: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 39/156

ELEKTRONIKA 3/2010 37

Fig. 11. The impact of the type of lter on measurement resultsRys. 11. Wp ływ rodzaju ltra na wyniki pomiarów

carried out for high values of nonlinear parameters μ1=10 5 [m-2]and μ1=10 5 [m -2] and asymmetries x 01 and x 02 equal to zero.

Butterworth – Chebyshev

Figures 11 presents the results of measurement with the useof two different lters: Butterworth and Chebyshev. For bothcases the lter orders n equal to 30. It can be noted that usingChebyshev lters will cause an increase of the measurementaccuracy. This accuracy increase is connected with the factthat Chebyshev lters turn out to be much more useful at me-asurements where the high slope of lter edges is required.However, when using these lters it should be kept in mindthat Chebyshev lters are featured with worse phase charac-teristics than those of Butterworth.

Fig. 12. Nonlinear distortion level depending on the parameter atthe excitation with white noiseRys. 12. Poziom zniekszta łce ń nieliniowych w zale żno ści od pa-rametruprzy pobudzeniu szumem bia łym ( μ 2=0)

Fig. 13. Nonlinear distortion level versus parameterat excitationwith pink noise ( μ 2=0)Rys. 13. Poziom zniekszta łce ń nieliniowych w zale żno ści od pa-rametruprzy pobudzeniu szumem ró żowym ( μ 2=0)

Fig.14. Measurement method diagram – future worksRys. 14. Schemat blokowy metody pomiarowej

When exciting the circuit with pink noise higher nonlineardistortion levels are obtained. The impact of the lter order

and its type at excitation with pink noise is the same as at me-asurements with white noise used as the excitation signal.

Summary and conclusions

In the article the impact of the type and digital lter parame-ters on the results of nonlinear distortion measurements ina loudspeaker is presented. At measurements it was decidedto use lters with in nite pulse response. The advantage ofIIR lters versus FIR ones is the fact that for the realisation ofthe same characteristics the former ones need less numberof coef cients, and due to that the IIR lter order is alwayslower. In case of adaptation of a digital lter at the DSP pro-cessor this feature is very important since a lower lter ordermakes its realisation possible within a shorter time. FIR ltersrequire more coef cients to get the sharp slopes of the am-plitude characteristics. This involves longer processing timeand require larger memory areas. Summing it up, IIR ltersare much more faster and less complex at calculations.

Analysing the results mentioned in the paragraph 4 a con-clusion comes to mind that a careful designing of digital ltersshould enable to achieve the accuracy of nonlinear distortionmeasurement better. The obtained results will be used at furt-her study of nonlinear distortions in loudspeakers.

The next stage of the research will be making measure-ments of real loudspeakers with the use of specialist appara-tus. In the drawing below a block diagram of the measuringmethod is shown:

So developed and veri ed measurement should allow to

Measurement carried out and hitherto re-sultsFigures 12 and 13 show the exemplary results of nonlinear di-stortion depending on nonlinearity coef cient μ1 and for μ2=0.using Butterworth lter of order n=30. To minimize the impactof additional distortions, the order n of lters IIP ought to be n ≥ 50, although the impact does not seem so signi cant any-more.

become better acquainted with the nature of the non-linear

distortions in loudspeakers. In the system being constructedinstead of a loudspeaker model presented with a differentiateequation a real loudspeaker will be placed.

Page 40: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 40/156

ELEKTRONIKA 3/201038

Estimation of delay between a sine signal of unknown initialphase and an ideal reference signal whose initial phase is as-sumed to be of zero value is a problem of considerable inte-rest in many areas of signal processing. It can nd numerousapplications, e.g., in a single channel of marine sonar, in bio-medical ultrasonograph (USG), in a defect nder, in defecto-scopy, etc. The solution presented below in Fig. 1 is quite sim-ple when the received signal is also an ideal sine. However, incase of presence of noise the situation is different and needsa more involved approach. Here we present and analyse theperformance of the delay estimators for the ideal and practicalcases. In the practical case we use a Hilbert transform lter(HTF) pair in order to estimate the phase difference betweenthe received signal embedded in AWGN (additive white Gaus-sian noise) relative to the ideal reference signal.

Problem statement

We assume that the received signal has the form

(1)

where the amplitude A>0, ω 0 is the angular frequency in ra-dians per sample whose value is known, φ [n] is the unknown

),0(],[])[cos(][ 00 π ω ω ++= n g nn An x ),0(],[])[cos(][ 00 π ω ω ++= n g nn An x

initial phase whose value we want to estimate/measure, g [n]stands for a AWGN realisation and n stands for the time index(number) of sample; n = 0, ±1, ... . We estimate the value of φ by comparison of (1) with the reference cosine signal (chrono-signal otherwise called the timing waveform)

(2)

whose initial phase is, by assumption, of zero value, and A1 may differ from A. For the target open-loop solution we applya complex linear-phase Hilbert lter (HTF).

Ideal case – real valued solution

In the ideal case (see Fig.1 ) we assume g [n]=0. Then

(3)and

as in (2). Multiplication of x [n] (3) by x r [n] shown in Fig. 1

)cos(][ 01 n An xr ω = )cos(][ 01 n An xr ω =

),0(]);[cos(][ 00 π ω ω += nn An x ),0(]);[cos(][ 00 π ω ω += nn An x

)cos(][ 01 n An xr ω = )cos(][ 01 n An xr ω =

)cos(])[cos(][][ 001 nnn AAn xn x r ω ω += )cos(])[cos(][][ 001 nnn AAn xn x r ω ω +=

A discrete-time sine wave delay estimator (Dyskretno-czasowy estymator opó źnienia sinusoidy)

prof. dr hab. in ż. EWA HERMANOWICZ, dr in ż. MIROS ŁAW ROJEWSKIGda ńsk University of Technology, Faculty of Electronics, Telecommunications and Informatics, Gda ńsk

References [1] PN-EN 60268-5:2005 – Urz ą dzenia systemów elektroakustyc-

znych – Cz ęść 5: G łośniki. [2] Lidia W. Lee, Earl R.: Geddes Auditory Perception of Nonlinear

Distortion. 115th Convention, 2003 October 10-13, New York. [3] Alex Voishvillo: Assessment of Nonlinearity in Transducers and

Sound Systems – from THD to Perceptual Models. 121st Con-vention 2006 October 5-8 San Francisco.

[4] Oppenheim A. V., Schafer R. W., Buck J. R.: Discrete-Time Sig-nal Processing. Prentice Hall, second edition, 1999.

[5] Oppenheim Alan V., Schafer Ronald W.: Cyfrowe przetwarzaniesygna łów. WK Ł, Warszawa 1979.

[6] Lyons Richard G.: Wprowadzenie do cyfrowego przetwarzaniasygna łów. WK Ł, Warszawa 2003.

[7] Szabatin Jerzy: Podstawy teorii sygna łów. WK Ł, Warszawa1982.

[8] Dą browski A.: Przetwarzanie sygna łów przy u życiu proce-sorów sygna łowych, Wydawnictwo Politechniki Pozna ńskiej,Wydanie 3.

[9] Imaka K., Ohga J.: A New Digital Measurement for Distortion of Acoustical Devices. 121st AES Convention, October 2004, Pre-print 6216.

[10] Nikado S.: On Distortion Measurement of Loudspeakers UsingProgrammed Sound. Reports of the 6th International Congresson Acoustics, vol. III D, Electroacoustics and Architectural Acous-tics, Tokyo, pp. 21-28 1968.

[11] Wolf V.: Dynamic Method of Nonlinear Distortion Investigation (inRussian). Radiotechnika. vol. 8, no. 2 pp. 27-37, 1953.

[12] Siczek R.: Application of digital lters for measurement of nonline-ar distortions in loudspeakers using Wolf’s method. Acoustics’08

Paris, June 29 – July 4, 2008.[13] Dobrucki A., Siczek R.: The measurement of nonlinear distortion

using broadband noise. LV Open Seminar on Acoustics, 2008.[14] Izydorczyk J., Konopacki J.: Filtry analogowe i cyfrowe.

Wydawnictwo Pracowni Komputerowej Jacka Skalmierskiego,Katowice 2003.

[15] Dobrucki A.: Przetworniki elektroakustyczne. Wydawnictwa Nau-kowo-Techniczne, Warszawa 2007.

])[cos(][ 0 nnn x ω +=

1− z

nn x r 0cos][ ω= 0

1ωarccos( )

][cos n ][ n ][ nd

Fig. 1. Block scheme of sine wave delay estimator in ideal case – without noise; real-valued solutionRys. 1. Schemat blokowy estymatora opó źnienia sinusoidy w przypadku idealnym – bez szumu; rozwi ą zanie rzeczywiste

Page 41: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 41/156

ELEKTRONIKA 3/2010 39

resolves to

where the second term in square brackets can be ltered outusing a simple low-pass lter. For example one can utilize a 2-point FIR ( nite impulse response) lter having the impulseresponse

the transfer function [2]

the frequency response

the amplitude response

and the phase response

At this lter output we obtain

where the asterisk stands for convolution, which resolves to

for ω 0 = /2 thus for f 0 = 0.25. With A 1 = A = 1 the result is

])][2cos(][[cos

2][][][ 0

11 nnn

AAn xn xn x r ω ++== ])][2cos(][[cos

2][][][ 0

11 nnn

AAn xn xn x r ω ++==

{ } { } ]1[][1,1][ 10 −+=== nnnh n δ δ { } { } ]1[][1,1][ 10 −+=== nnnh n δ δ

11)( −−= z z H 11)( −−= z z H

2

cos21)( 2/ ω ω ω ω j j j eee H −− =−=2

cos21)( 2/ ω ω ω ω j j j eee H −− =−=

π ω

ω ω <= ,2

cos2)( je H π ω ω ω <= ,2

cos2)( je H

2

)(arg ω ω −= je H

2)(arg

ω ω −= je H

{ } { }]1[][])[2cos(][cos

2

][][][

01

12

−+++===

nnnnn AA

nhn xn x

δ δ ω

{ } { }]1[][])[2cos(][cos

2

][][][

01

12

−+++===

nnnnn AA

nhn xn x

δ δ ω

][cos][ 12 n AAn x = ][cos][ 12 n AAn x =

][cos][2 nn x = ][cos][2 nn x =

Consequently the initial phase we are looking for can be ob-tained as

which is equal to φ [n] as expected. Therefore the correspon-ding delay between x [n] and x r [n]

is a fraction of a sample interval. Fig. 2a shows the resultsobtained in the scheme from Fig. 1 by using the following in-put signals: , see (3), and ,see (2), of 256 samples each with the initial phase from the in-terval changed by φ [n] = /20 while Fig. 2bpresents the results for the input signal with AWGN g [n], see(1), such that the signal to noise ratio is SNR=40 dB. We canobserve that even for this relatively high SNR the delay esti-mates are strongly in uenced by noise especially for verysmall sub sample or fractional values of delay d . In order tocombat this undesirable effect we use further the scheme pre-sented in Fig. 3.

Practical case – complex valued open-loopsolution

Estimation of delay between two sine waves embedded innoise can be realized using the block scheme from Fig. 3 .There both input signals: x [n] (1) and x r[n] (2) are passedthrough the HTF – Hilbert transform lter having the impulseresponse

and the transfer function

where j 2 = –1. The frequency response of this lter is

][arccos][ 2 n xn = ][arccos][ 2 n xn =

π

ω

π ω

][2][][

2/0

nnnd

o

===

π

ω

π ω

][2][][

2/0

nnnd

o

===

])[2cos(][ nnn x π += ])[2cos(][ nnn x π += 2cos][ nn xr π = 2cos][ nn xr π =

]4/,20/[][ π π n ]4/,20/[][ π π n

{ } { }]2[]1[2][21

21

,,21

][ 20 −−−+=−== nn jn jnh n δ δ δ

{ } { }]2[]1[2][21

21

,,21

][ 20 −−−+=−== nn jn jnh n δ δ δ

( ) 12121)( −− +−= jz z z H ( ) 12121)( −− +−= jz z z H

a) b)

Fig. 2. The results of sine wave delay estimation using the scheme from Fig. 1: a) without noise and b) with AWGN with SNR=40 dBRys. 2. Wyniki estymacji sinusoidy za pomoc ą schematu z rys. 1: a) bez szumu i b) z addytywnym szumem gaussowskim (AWGN) zestosunkiem mocy sygna łu do szumu SNR=40 dB

Page 42: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 42/156

ELEKTRONIKA 3/201040

Fig. 3. Block scheme of our sine wave delay estimator in practical case – with noise; complex valued open-loop solution. For ACC-MA(accumulator-moving average) see [3], with leakage z p close to 1Rys. 3. Schemat blokowy naszego estymatora opó źnienia sinusoidy w przypadku praktycznym – z szumem; rozwi ą zanie zespolonez otwart ą p ętlą . ACC-MA (akumulator – system ruchomej ś redniej) omówiono w [3] z przeciekiem z p o warto ści bliskiej 1

*)(

][n x

2− z 2/1−

+

1− z j

][n xr

2− z −

+

1− z j

)Arg(

021 f π

1− z

][ˆ nd

][n yr

][n y

][n p

2/1

][ˆ n

][~

nd

][nv2/1

HTF

HTF

MA-ACC

p z

p z −1

Fig. 4. The results of sine wave delay estimation using the scheme from Fig. 3 with A =1, A 1 = √2 A and f 0 = 0.2505: a) without noise andb) with AWGN for SNR=15 dB; z p = 0.95Rys. 4. Wyniki estymacji opó źnienia sinusoidy za pomoc ą schematu z rys. 3 z A=1, A 1 = √2 A i f 0 = 0.2505: a) bez szumu i b) z szumemAWGN z SNR=15 dB; z p = 0.95

a) b)

Therefore for this lter we have the amplitude response

)sin1()( ω ωω += − j j jee H )sin1()( ω ωω += − j j jee H

sin1)( ω ω += je H sin1)( ω ω += je H

the phase response

<<−−−

<<−=

0;2

0;2)(arg

ω π ω π

π ω ω π ω je H

<<−−−

<<−=

0;2

0;2)(arg

ω π ω π

π ω ω π ω je H

Page 43: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 43/156

ELEKTRONIKA 3/2010 41

control – AGC to enable this. Fig. 6 shows the reaction of theHTF on the reference signal detuning as a result of lacking offeedback in the open loop.

Concluding remarks

In the paper a novel solution of sine wave sub sample time de-lay estimator operating in an open loop was presented basedon a concept of Hilbert transforming the real-valued signalwhose initial amplitude, phase and delay are unknown. Thissolution favourably compares with that with closed-loop ap-proaches presented in [1] and [3] as it has lower numericalcomplexity.

References[1] Maskell D.L., Woods G.S.: Adaptive subsample delay estimator

using quadrature estimator. Electronics Letters, 4 th March 2004,vol. 40, no. 5, pp. 347-349.

[2] Mitra S.K.: Digital Signal Processing: A Computer Based Ap-proach. McGraw-Hill. 1998.

[3] Hermanowicz E., Rojewski M.: Fractional delayor application inself-tuning sub-sample delay estimator. Elektronika nr 3, 2009,ss. 43-46.

and the group delay response

grd H (e jω ) = 1

At this lter output we obtain

yr [n] = xr [n] * h[n]which is equal to:

Also:

which for g [n]=0 is equal to

As a result of trigonometric manipulations we obtain:

and:

respectively. Hence in Fig. 3 the complex cross-power wave-form between y [n] and y r[n] is:

where the asterisk stands for complex conjugate andas desired. Finally .

Figures 4 and 5 illustrate the operation of the proposed de-lay estimator using two different values of the input signal (1)centre frequency and signal to noise ratio. All this is not po-ssible to attain in the real valued solution from Fig. 1. Also, theestimator from Fig. 3 operates satisfactorily well with different

amplitudes of both input signals: (1) and (2), while the esti-mator from Fig. 1 would need an additional automatic gain

)]}2(cos[)]1(cos[2){cos(2

][ 0001 −−−+= nn jn

An yr ω ω ω )]}2(cos[)]1(cos[2){cos(

2][ 000

1 −−−+= nn jn A

n yr ω ω ω

][][][ nhn xn y = ][][][ nhn xn y =

])]}[)2(cos[

]][)1(cos[2])[{cos(2

][

0

00

nn

nn jnn A

n y

ω

ω ω

+−−

++−++=

])]}[)2(cos[

]][)1(cos[2])[{cos(2

][

0

00

nn

nn jnn A

n y

ω

ω ω

+−−

++−++=

)exp(][ 01 n j An yr ω = )exp(][ 01 n j An yr ω =

])][(exp[][ 0 nn j An y ω += ])][(exp[][ 0 nn j An y ω +=

( ) ])[exp(][][][ 1 n j AAn yn yn p r == ( ) ])[exp(][][][ 1 n j AAn yn yn p r ==

][][ˆ nn = ][][ˆ nn =0/][][ˆ ω nnd = 0/][][ˆ ω nnd =

Fig. 6. Plots of y r [n ] in the scheme from Fig. 3 with A =1, A 1 = √2 Aand: a) f 0 = 0.2505 with b) with f 0 = 0.25Rys. 6. Wykresy y r [n ] w systemie z rys. 3 z A =1, A 1 = √2 A i:a) z f 0 = 0,2505 b) z f 0 = 0,25

Fig. 5. The results of sine wave delay estimation using thescheme from Fig. 3 with A =1, A 1 = √2 A and f 0 = 0.25 and AWGNfor SNR=15 dB; z p = 0.95Rys. 5. Wyniki estymacji opó źnienia sinusoidy za pomoc ą sche-matu z rys. 3 z A =1, A 1 = √2 A and f 0 = 0,25 a) bez szumu i b) z szu-mem AWGN z SNR=15 dB; z p = 0,95

a)

b)

Page 44: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 44/156

ELEKTRONIKA 3/201042

Wspó łczesne urz ą dzenia do cyfrowej rejestracji i wy świetla-nia obrazów nie odwzorowuj ą ca łego zakresu dynamicznegoludzkiego wzroku. Dlatego na zdj ęciach o zró żnicowanychpoziomach jasno ści (np. zawieraj ą cych fragmenty zacienio-ne i fragmenty nas łonecznione) obiekty zacienione s ą niedo-świetlone i w konsekwencji s ą widoczne na zdj ęciu jako czar-ne lub prawie czarne obszary z niewielk ą ilością szczegó łów,a obiekty nas łonecznione s ą prze świetlone i dlatego s ą wi-doczne na zdj ęciu jako obszary bia łe lub prawie bia łe, tak żez niewielk ą ilością szczegó łów. Wskutek tego otrzymuje si ę

zdjęcie niskiej jako ści. Problem ten jest szczególnie istotnyw przypadku zdj ęć wykonywanych z lamp ą b łyskow ą skie-rowan ą wprost na fotografowany obiekt. Wówczas pierwszyplan jest znacznie prze świetlony, a dalsze – s ą niedo świet-lone. Podobna sytuacja ma miejsce np. przy fotografowaniuobiektów wewn ą trz pomieszcze ń bez u życia lampy b łyskowejna tle okien, tj. gdy wewn ą trz pomieszczenia jest stosunkowociemno, a na zewn ą trz – jasno. Nieprawid łowe odwzorowaniebarw i jasno ści jest szczególnie zauwa żalne w przypadku ta-nich kamer i tanich aparatów fotogra cznych.

W ostatnim czasie rozwijane s ą intensywnie techniki HDR(ang. High Dynamic Range of Illumination ) [1-3], polegaj ą cena sk ładaniu jednego nalnego zdj ęcia z trzech lub wi ęcejkolejno wykonanych zdj ęć o ró żnych na świetleniach (zdj ęcieniedo świetlone, zdj ęcie na świetlone standardowo i zdj ęcieprze świetlone). W ostatecznym zdj ęciu fragmenty niedo świet-lone pochodz ą ze zdj ęcia prze świetlonego, a – prze świetlonez niedo świetlonego, co zapewnia prawid łowe odwzorowaniewszystkich fragmentów nalnego zdj ęcia i w konsekwencjikorzystnie powi ększony zakres dynamiczny. W ten sposóbmo żna fotografowa ć jednak jedynie obiekty nieruchome, dys-ponuj ą c aparatem umieszczonym na statywie.

W niniejszym artykule przedstawiono metod ę umo żliwia- ją cą wykonanie zdj ęć o zwi ększonym zakresie dynamicznymna podstawie pojedynczego zdj ęcia cyfrowego zapisanegow formacie RAW.

Większo ść lustrzanek cyfrowych dysponuje 12- a nawet14-bitowymi procesorami do przetwarzania obrazów [4-6].Zdjęcia z kwantyzacj ą 12 lub 14 bitów ka żdej ze sk ładowych

Powi ększanie zakresu dynamicznego zdj ęćzapisanych w formacie RAW

mgr in ż. ADAM KONIECZKA, mgr in ż. JULIAN BALCEREK,prof. dr hab. in ż. ADAM D Ą BROWSKI

Pozna ń University of Technology, Institute of Control and System Engineering,

Division of Signal Processing and Electronic Systems

RGB s ą zapisywane w tzw. formacie RAW. Ich pó źniejszeprzetworzenie jest mo żliwe w znacznie szerszym zakresie dy-namicznym ni ż w przypadku zdj ęć zapisanych od razu w for-macie JPG (8 bitów na ka żdą sk ładow ą RGB).

Rozja śnianie lub przyciemnienie zdj ęcia jest zwi ą zanez przesuni ęciem histogramu. Przesuwaj ą c histogram plikówJPG zmniejsza si ę liczb ę kolorów wyst ępują cych w zdj ęciui traci si ę bardzo jasne lub bardzo ciemne szczegó ły. Nato-miast przesuwanie histogramu plików RAW nie musi skutko-wa ć istotnym zmniejszeniem liczby kolorów nalnego zdj ęcia

w formacie JPG, a wi ęc zamazaniem bardzo jasnych lub bar-dzo ciemnych szczegó łów w ostatecznym zdj ęciu. Pojedynczezdjęcie zapisane w formacie RAW mo żna przekonwertowa ć do plików JPG z ró żnymi jasno ściami, zachowuj ą c przy tymznacznie wi ęcej szczegó łów ni ż w przypadku rozja śniania lubprzyciemniania zdj ęć zapisanych od razu w formacie JPG.W ten sposób powstaje kilka wersji (np. trzy) tego samego zdj ę-cia, ró żnią ce si ę jasno ścią zupe łnie tak, jakby by ły oddzielniewykonane przy ró żnych na świetleniach. W ten sposób mo żnawięc pozyska ć materia ł konieczny do powi ększenia zakresudynamicznego. Zauwa żmy, że ta technika nie jest ograniczonado fotografowania tylko obiektów nieruchomych, jak w przy-padku serii zdj ęć zapisywanych od razu w formacie JPG.

Proponowana metoda przetwarzania obrazu

Pierwszym etapem jest skorzystanie z programu do przetwarza-nia zdj ęć w formacie RAW dostarczonym np. przez producentaaparatu fotogra cznego. W niniejszej pracy wykorzystano apa-rat Canon 400D z obiektywem Canon 50 mm f/1.8 EF II orazprogram Digital Photo Professional w wersji 3.4.1.1. W zdj ęciunale ży skorygowa ć balans bieli, nasycenie kolorów, redukcj ę szumów oraz ewentualnie inne parametry. Nast ępnie nale ży tozdjęcie zapisa ć do trzech plików JPG z ró żnymi ustawieniamiBrightness adjustment. Jedno zdj ęcie powinno by ć na świetlonestandardowo, drugie – prze świetlone, a trzecie – niedo świet-lone. Zale żnie od wielko ści ró żnic w na świetleniu poszczegól-nych fragmentów kadru za łożono, że ró żnice jasno ści kolejnychzdjęć mieszcz ą się w zakresie od 0,5 do 2 EV.

Rys. 1. Zdj ęcia przekonwertowane z formatu RAW: a) zdj ęcie po zapisaniu z korekcj ą -2 EV; b) zdj ęcie po zapisaniu bez korekcji EV(optymalne); c) zdj ęcie po zapisaniu z korekcj ą +2 EVFig. 1. Photographs converted from the RAW format: a) picture with -2 EV brightness correction; b) picture without any brightnesscorrection (optimal); c) picture with +2 EV brightness correction

a) b) c)

Page 45: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 45/156

ELEKTRONIKA 3/2010 43

Drugim etapem jest wykorzystanie programu napisanegoprzez autorów w środowisku programistycznym Matlab w wer-sji 7.1. Program ten wczytuje wszystkie trzy zdj ęcia. Nast ępniedla ka żdego piksela zdj ęcia na świetlonego standardowo jestde niowana kwadratowa maska o wymiarach 7x7 pikseli, którejśrodkiem jest aktualnie przetwarzany piksel. Pikseli le żą cychprzy kraw ędzi zdj ęcia nie przetwarza si ę. Dla pikseli le żą cychw obr ębie maski oblicza si ę średni ą luminancj ę Lm ze wzoru:

(1)

gdzie: x , y – wspó łrzędne pikseli w masce, R x,y – warto ść sk ła-dowej R piksela o wspó łrzędnych x,y , G x,y – warto ść sk łado-wej G piksela o wspó łrzędnych x,y , B x,y – warto ść sk ładowej Bpiksela o wspó łrzędnych x,y .

Je śli warto ść Lm jest wi ększa od 128, a wi ęc od po łowyzakresu (0–255) mo żliwych jasno ści zdj ęcia, przyjmuje si ę, żewarto ść ka żdej sk ładowej RGB obliczanego piksela nalnegozdjęcia (oznaczona ogólnie jako V f ) jest obliczana wed ług na-

st ępują cej proporcji, przedstawionej te ż gra

cznie na rys. 2 .

(2)

gdzie: V m – warto ści sk ładowych RGB piksela b ędą cego środ-kiem maski w zdj ęciu optymalnym, V u – warto ści sk ładowychRGB piksela b ędą cego środkiem maski w zdj ęciu niedo świet-lonym, V f – warto ści sk ładowych RGB piksela b ędą cego środ-kiem maski w zdj ęciu nalnym.

49

114,0587,0299,07

1

7

1,,,∑∑= =

++= y x

y x y x y x

m

BG R

L , 49

114,0587,0299,07

1

7

1,,,∑∑= =

++= y x

y x y x y x

m

BG R

L ,

um

f mm

V V

V V L−−

=−128

128,

um

f mm

V V

V V L−−

=−128

128,

Tak wi ęc:

(5)

Dzia łanie wzorów (2) i (4) mo żna zwi ększy ć za pomoc ą zale żno ści (5) i (6), w których lewe strony zale żno ści (2) i (4)

wyst ępuj ą w drugiej pot ędze. Jeszcze silniejszy efekt uzysku- je si ę za pomoc ą zale żno ści (7) i (8), w których lewe stronyzale żno ści (2) i (4) wyst ępują w trzeciej pot ędze. Stosowaniewyższych pot ęg nie przynosi ju ż korzystnych efektów:

(6)

(7)

oraz:

(8)

(9)

Analiza wyników

Stosuj ą c wzory (6) i (7) lub (8) i (9) uzyskuje si ę zdjęcia bardziejkontrastowe ni ż za pomoc ą wzorów (2) i (4), gdy ż w przypadkuwzorów (6), (7) i (8), (9) skoncentrowanie warto ści pikseli wokó ł środków ich zakresów jest mniejsze. Zjawisko to przedstawio-no na przyk ładzie zdj ęcia pokazanego na rys. 4 , powsta łego zezdjęć pierwotnych, ró żnią cych si ę na świetleniem o 2 EV.

Jak wida ć, zakres dynamiczny jest najkorzystniej poszerzo-ny na zdj ę ciu 4b – twarz jest najja śniejsza, a drobne szczegó ływ oddali najlepiej dostrzegalne. Odbywa si ę to jednak kosztemma łego kontrastu, co potwierdza nieco zaw ężony histogramwzgl ędem zdj ęcia standardowo na świetlonego 4a . Za lepszemo żna by wi ęc uzna ć zdj ę cia 4c i 4d , w przypadku którychkontrast wydaje si ę być bardziej naturalny dla ludzkiego oka.

Duży wp ływ na jako ść nalnego zdj ęcia ma tak że wielko ść zastosowanej maski s łużą cej do obliczenia Lm wzgl ędem wiel-kości zdj ęcia. Dla masek o ma łych wymiarach nast ępuje cz ęś -ciowa utrata drobnych szczegó łów poprzez pogorszenie kon-trastu zdj ęcia, pomimo wierniejszego oddania kolorów. Gdymaska jest du ża, efekt powi ększenia zakresu dynamicznegostaje si ę mniej zauwa żalny lokalnie dla drobnych szczegó łów

zdjęcia, dzi ęki czemu zdj ęcie wydaje si ę bardziej naturalne.Niestety, przy du żych maskach, na granicy obiektów bardzoróżnią cych si ę jasno ścią , pojawiaj ą si ę przek łamania jasno ś-ci. Kraw ędzie od strony jasnej nienaturalnie si ę rozja śniaj ą ,

( )mom

m f V V L

V V −−+=128

128 ( )mom

m f V V L

V V −−+=128

128

um

f mm

V V

V V L−−

=

− 2

128128

um

f mm

V V

V V L−−

=

− 2

128128

mo

m f m

V V

V V L−−

=

− 2

128128

mo

m f m

V V

V V L−−

=

− 2

128128

um

f mm

V V

V V L−−

=

− 3

128128

um

f mm

V V

V V L−−

=

− 3

128128

mo

m f m

V V

V V L−−

=

− 3

128128

mo

m f m

V V

V V L−−

=

− 3

128128

Rys. 2. Sposób obliczania warto ści sk ładowych RGB w nalnymzdj ęciu dla L m>128Fig. 2. Method for calculation of RGB values in nal picture for

Lm >128

Tak wi ęc:

(3)

Je śli warto ść Lm jest mniejsza od 128, a wi ęc od po łowyzakresu (0–255) mo żliwej jasno ści zdj ęcia, przyjmuje si ę, żewarto ść ka żdej sk ładowej RGB piksela nalnego zdj ęcia (po-nownie oznaczona jako V f ) jest obliczana z nast ępują cej pro-porcji (4), przedstawionej gra cznie na rys. 3 .

(4)

gdzie: V o – warto ści sk ładowych RGB piksela b ędą cego środ-kiem maski w zdj ęciu prze świetlonym.

( )mum

m f V V L

V V −−+=128

128 ( )mum

m f V V L

V V −−+=128

128

mo

m f m

V V

V V L

−=−

128

128,

mo

m f m

V V

V V L

−=−

128

128,

Rys. 3. Sposób obliczania warto ści sk ładowych RGB w nalnymzdj ęciu dla L m <128Fig. 3. Method for calculation of RGB values in nal picture forLm<128

Page 46: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 46/156

ELEKTRONIKA 3/201044

a od strony ciemnej – przyciemniaj ą . Dla zdj ęć 4a–d o roz-dzielczo ści 1200x800 pikseli zastosowano mask ę 7x7 pikseli.Rys. 5 przedstawia efekty zastosowania ró żnych wielko ścimasek na zdj ęciu o wymiarach 1200x800 pikseli, powsta łym

ze zdj ęć ró żnią cych si ę na świetleniem o 2 EV. Prezentowanefragmenty maj ą wymiary 160x100 pikseli.

Rysunek 6 przedstawia porównanie prezentowanej metodyz prost ą metod ą obni żania kontrastu. Zdj ę cie 6b jest zdj ęciem

Rys. 4. Standardowo na świetlone zdj ęcie pierwotne wraz z wariantami zdj ęć nalnych: a) zdj ęcie na świetlone standardowo i jegohistogram; b) zdj ęcie i jego histogram po przetworzeniu (korekcja ±2 EV) przy u życiu wzorów (2) i (4); c) zdj ęcie i jego histogrampo przetworzeniu (korekcja ±2 EV) przy u życiu wzorów (6) i (7); d) zdj ęcie i jego histogram po przetworzeniu (korekcja ±2 EV) przy

u życiu wzorów (8) i (9)Fig. 4. Standard exposed origibal picture and its nal variants: a) original picture without any brightness correction and its histo-gram; b) picture and its histogram after processing (±2 EV correction) by using formulas (2) and (4); c) picture and its histogramafter processing (±2 EV correction) by using formulas (6) and (7); d) picture and its histogram after processing (±2 EV correction) byusing formulas (8) and (9)

a) b) c) d)

Rys. 5. Porównanie fragmentów zdj ęć przy ró żnych maskach: a) fragment zdj ęcia na świetlonego standardowo; b) fragment zdj ęciapo przetworzeniu (korekcja ±2 EV, wg wzorów (6) i (7)) – przy u życiu maski 3x3 piksele; c) fragment zdj ęcia po przetworzeniu (korek-cja ±2 EV, wg wzorów (6) i (7)) – przy u życiu maski 7x7 pikseli; d) fragment zdj ęcia po przetworzeniu (korekcja ±2 EV, wg wzorów (6)i (7)) – przy u życiu maski 15x15 pikseliFig. 5. Comparison of picture fragments for various masks: a) part of original picture without any brightness correction; b) part oforiginal picture after processing (±2 EV correction) by using formula (6), (7) and 3x3 pixels mask; c) part of original picture after pro-cessing (±2 EV correction) by using formula (6), (7) and 7x7 pixels mask; d) part of original picture after processing (±2 EV correction)by using formula (6), (7) and 15x15 pixels mask

Rys. 6. Porównanie fragmentów zdj ęć : a) fragment zdj ęcia na świetlonego standardowo; b) fragment zdj ęcia o maksymalnie obni żo-nym kontra ście; c) fragment zdj ęcia po przetworzeniu (korekcja ±2 EV, wg wzorów (6) i (7)) – przy u życiu maski 7x7 pikseliFig. 6. Comparison of picture fragments: a) part of original picture without any brightness correction; b) part of original picture withlower contrast; c) part of original picture after using our method (formulas (6), (7) and 7x7 pixels mask)

na świetlonym standardowo, zapisanym w programie DigitalPhoto Professional w wersji 3.4.1.1 z minimalnym dost ępnymkontrastem.

Jak wida ć, w przypadku plików RAW obni żenie kontrastu

umo żliwia cz ęściowo poszerzenie zakresu dynamicznego, jednak odbywa si ę to w stopniu niedostatecznym i powodujeutrat ę szczegó łów, co nie ma miejsca w przypadku propono-wanej metody.

a) b) c) d)

a) b) c)

Page 47: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 47/156

ELEKTRONIKA 3/2010 45

WnioskiPrzedstawiona metoda powi ększania zakresu dynamiczne-go zdj ęć mo że by ć stosowana dla pojedynczych zdj ęć orazdla sekwencji wizyjnych w sytuacji, gdy istnieje dost ęp dodanych RAW. Ma zastosowanie w przypadku, gdy jednefragmenty rejestrowanych zdj ęć s ą znacznie prze świetlone,a inne niedo świetlone. Mo że by ć wykorzystana w przypadkumonitoringu, gdy w polu widzenia kamery znajduj ą się silneźród ła świat ła (np. latarnie uliczne) oraz miejsca bardzo s ła-bo o świetlone.

Dzięki mo żliwości regulacji wielko ści maski oraz korekcjina świetlenia łą czonych zdj ęć, mo żna uzyska ć optymalne re-zultaty dla wi ększo ści przypadków. Niew ą tpliwą zalet ą me-tody jest niewielka obliczenioch łonno ść i fakt, że obliczeniamog ą by ć wykonywane równolegle dla ró żnych fragmentów

jednego zdj ęcia.W dalszych etapach prac autorzy planuj ą opracowanie al-

gorytmu automatycznego wyboru wielko ści maski dla ró żnych

fragmentów zdj ęcia, aby unikn ąć nieodpowiednich zmian jas-no ści zaprezentowanych na przyk ładzie zdj ęć na rys. 5b–d .

Praca jest wspó ł nansowana z projektów INDECT i 93-182/10 DS.

Literatura

[1] Várkonyi-Kóczy A.R., Rövid A., Hashimoto T.: HDR Colored In-formation Enhancement Based on Fuzzy Image Synthesization.Intelligent Signal Processing, 2007. WISP 2007. IEEE Interna-

tional Symposium on 3–5 Oct. 2007, pp. 1–6.[2] Mantiuk R., Krawczyk G., Myszkowski K., Seidel H.: Perception-motivated High Dynamic Range Video Encoding. ACM Transac-tions on Graphics TOG (2004), ACM Press, pp. 733–741.

[3] Wang J., Kang Y.: A New MSBF-based HDR Image Processing Algorithm. Cybernetics and Intelligent Systems, 2008 IEEE Con-ference on 21–24 Sept. 2008, pp. 1232–1237.

[4] http://www.dpreview.com/news/0011/00111701dynamicrange_ raw.asp

[5] http://www.cambridgeincolour.com/tutorials/RAW- le-format.htm[6] http://www.normankoren.com/digital_tonality.html

Finite impulse response (FIR) ltering, based on lter charac-teristics de ned in the Fourier transform domain (frequencydomain) is one of the most basic and fundamental procedureswithin the area of digital signal processing [8]. On the otherhand the discrete trigonometric transforms (DTTs) seem toattract some attention in the context of ltering similar to thewell known convolution, which is the result of the convolution-multiplication property described for the case of the symmetricconvolution proposed by Martucci [1]. Some examples of suchapplications may be found in [4, 7, 9].

In this paper novel approach based on the generalizedconvolution matrix de ned for the DTTs [2-4] is proposed anddocumented with a set of computational examples.

The concept exploits the rectangular windowing of therows of that matrix in the manner resembling such windowingapplied to the circular convolution matrix derived for a givenFIR lter de ned in the Fourier transform (frequency) domain.The examples provided for all DTTs and various lter shapes,de ned in the transform domain, con rmed that the proposedsolution does not distort the assumed lter response shapesmore than in the classical Fourier case.

DTTs and the generalized convolution matrix

The DTTs may be de ned in several equivalent ways [1, 6],the differences are rather subtle. Here, the de nition proposedin [3, 4] has been applied.

Let us assume that the DTTs are numbered from 1 to 16,

according to [2, 4], which gives 8 discrete cosine transforms(DCTs), and 8 discrete sine transforms (DSTs).

The generalized convolution matrix is a square matrix, de-noted here by Q, with the number of rows and columns equalto the length of the signal block, say N . If the input signal blockand the output signal block are N -element vectors x and y,respectively, then the ltering process performed entirely inthe original signal domain may be described by the followingmatrix equation [2-4]:

y = Q · x (1)

For the discrete Fourier transform (DFT) matrix Q beco-mes the circular convolution matrix [4, 8]. Examples of Q ma-trices for the DTTs and the half-band low-pass lters may befound in [2-4].

Windowing of the convolution matrixReference DFT-based FIR lter

The classical FIR ltering based on DFT will be used in thispaper as reference or a kind of benchmark. For the block oflength N , the ideal lter DFT sequence must contain 1’s (ones)

in the pass-band located in a manner satisfying the requiredsymmetry for the lter impulse response to remain real valued[8]. Considering the low-pass lter there must be M 1’s at thebeginning of the DFT sequence, and M –1 1’s at the end of it,

Discrete trigonometric transform (DTT) lters(Filtry realizowane za pomoc ą

dyskretnych transformacji trygonometrycznych (DTT))

dr in ż. PRZEMYS ŁAW KOROHODA 1, prof. dr hab. in ż. ADAM D Ą BROWSKI 2,1 University of Science and Technology AGH, Chair of Electronics, Kraków,

2 Pozna ń University of Technology, Chair of Control and System Engineering, Pozna ń

Page 48: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 48/156

ELEKTRONIKA 3/201046

which makes the total of P =2 M –1 1’s. The remaining valuesshould be set to zero. The high-pass lter in the DFT domainmay be obtained form the low-pass sequence by replacing1’s by 0’s ans 0’s by 1’s, while the band-pass and band-reject lters can be sub-optimally designed with the relevant linearcombination of the low-pass and the high-pass lters.

The inverse DFT results in the impulse response, whichshould surround the zero point in the original domain but thecircular nature of the DFT makes it relevantly located along

the N samples sequence [8]. Typically, the impulse responseis shifted so that the lter becomes causal, but keeping it inta-ct makes the imaginary part of the Fourier domain not neces-sary, which simpli es the forthcoming comparisons.

Additionally, the block-based nature of this study makescausality the not required feature of the lter.

The rectangular window in such case must contain a num-ber of 1’s, say K , at the beginning of the sequence in the im-pulse response domain, and K –1 at the end of it. The rema-ining values must be 0’s. Thus, the total number of the FIRcoef cients is L=2· K –1.

In the circular convolution matrix the impulse response isshifted between rows, thus the window must move accordin-

gly. Fig. 1 shows the example of location of the non-zero win-dow elements. The structure depicted in Fig. 1 may be de nedas the window matrix. After term-by-term multiplication of it bythe Q matrix, the so-called windowed FIR lter is obtained.The indexes n x and n y refer to the input and output signal,respectively – compare expression (1).

twice in the horizontal direction to match the frequencies builtin the DTTs.

Experiment with DTTs

The performed experiment was designed to provide compari-son of the distorted characteristics as a result of windowing inthe signal domain for the DTTs and for the DFT. In each casethe number and location of 1’s and the lenght L were de ned.

The window matrix, shown in Fig. 1 , was the same for theDTTs and for the DFT. The relevant ideal lter characteristicwas initiated and then the Q matrix was computed, as descri-bed in [2-4]. Afterwards the convolution matrix was multipliedby the window matrix. The input signal, x, was obtained in thefollowing way. In the transform domain of the given transformthe all-ones sequence was modi ed by adding the pseudoran-domly generated values from the range [–0.3, +0.3]. Then thesequence (the roof mark denotes the transform domain), wasinversely transformed, and the result was taken as the inputsignal. Such signal was multiplied by the windowed Q matrix,see (1), which gave the lter output sequence in the form ofvector y. The term-by-term division of by was taken as the

resulting

lter characteristic in the transform domain.

Results

The selected, representative results are presented below inthe graphic form. The DTTs characteristics are depicted by thedots showing their exact values, while the reference DFT ltershapes are shown in a form of a marker-free lines obtainedafter interpolation of the relevant DFT sequences. Note, thatall characteristics are real-valued in contrast to complex num-bers, typically expected for the DFT. This was the result ofaccepting the non-causal FIR lters for the DFT.

In the description of lters, parameter P represents thenumber of 1’s in the DTT sequence for the low-pass lter, andk min denotes the minimum frequency index for the rst 1 (one)in the DTT high-pass sequence. The ideal band-pass andband-stop characteristics in the DTT domains are describedby the minimum and the maximum frequency indexes of theband, i.e., k min and k max , respectively.

In Fig. 2 an example of the low-pass lter ( N =256, P =63,

Fig. 1. Example of the location of non-zero values (dark pixels)on the area of the convolution matrix Q, resulting from windo-wing with the assumed window length L=13 and signal blocklength N =64Rys. 1. Przyk ład rozk ładu elementów niezerowych (ciemne pikse-le) w obr ębie macierzy splotowej Q, wynikaj ą cy z zastosowaniaokna o przyj ętej d ługo ści L=13 i wielko ści bloku sygna łu N =64

DTTs and DFT (frequency domain) resolution

Filters de ned in the domains of DTTs, for the same numerof 1’s as for the reference DFT, cover practically the samerange of frequencies. However, there are about twice as manysamples in the transform domain for DTTs, as for the DFTfrequency range, which means that for the xed number of1’s DTTs provide doubled frequency precision as comparedto the DFT based FIR lters. On the other hand, the valuesalong the main diagonal of the convolution matrix Q in thecase of DTTs are somewhat varying [2] in contrast to the DFT,and therefore, the exact convolution theorem does not holdfor the DTTs. The just mentioned changes in Q may be consi-dered as the price paid for the advantage of better frequencyrepresentation. The properly managed trade-off between the

indicated features should be respected in the art of ef cientDTTs based ltering.

As a result of the reasoning presented above, the referen-ce lter characteristics in the DFT domain should be spread

Fig. 2. The low-pass lter characteristic resulting from the de-scribed windowing technique for the DCT-II-even (DTT number2) N =256, P =63, L=15 (line with dot markers) compared to thereference FIR DFT lter characteristic (the thin line without mar-kers)

Rys. 2. Charakterystyka ltru dolnoprzepustowego otrzymanaza pomoc ą opisanej metody okna dla DCT-II-parzystej (DTT nu-mer 2) N =256, P =63, L=15 (linia z kó łeczkami) w porównaniu docharakterystyki referencyjnego ltru FIR DFT (cienka linia bezmarkerów)

Page 49: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 49/156

ELEKTRONIKA 3/2010 47

Fig. 3. Half-band lter characteristics resulting from the describedwindowing technique for the DCTs (consecutive lines with dots)compared with the reference FIR DFT lter characteristic (the thinlines without markers) N =64, P =33, L=13, vertical axis in dBRys. 3. Charakterystyki ltrów pó łpasmowych projektowanych opi-san ą metod ą okna dla transformat DCT (kolejne linie z kó łeczka-mi) w porównaniu z charakterystyk ą referencyjnego ltru FIR DFT(cienkie linie bez markerów) N =64, P =33, L=13, o ś pionowa w dB

Fig. 4. Half-band lter characteristics resulting from the describedwindowing technique for the DSTs (consecutive lines with dots)compared with the reference FIR DFT lter characteristic (the thinlines without markers) N =64, P =33, L=13, vertical axis in dB

Rys. 4. Charakterystyki ltrów pó łpasmowych projektowanychopisan ą metod ą okna dla transformat DST (kolejne linie z kó-łeczkami) w porównaniu z charakterystyk ą referencyjnego ltruFouriera FIR DFT (cienkie linie bez markerów) N =64, P =33, L=13,oś pionowa w dB

Fig. 5. The high-pass lter characteristic resulting from the des-cribed windowing technique for the DCT-II-even (DTT number 2)N =256, k min =128, L=15 (line with dot markers) compared to the refe-rence FIR DFT lter characteristic (the thin line without markers)Rys. 5. Charakterystyka ltru górnoprzepustowego otrzymana zapomoc ą opisanej metody okna dla DCT-II-parzystej (DTT numer 2)N =256, P =63, L=15 (linia z kó łeczkami) w porównaniu do charak-terystyki referencyjnego ltru FIR DFT (cienka linia bez markerów)

Fig. 6. The band-pass lter characteristic resulting from the descri-bed windowing technique for the DCT-II-even (DTT number 2) N =256,k min =63, k max =126, L=15 (line with dot markers) compared to the refe-rence FIR DFT lter characteristic (the thin line without markers)Rys. 6. Charakterystyka ltru pasmowoprzepustowego otrzyma-na za pomoc ą opisanej metody okna dla DCT-II-parzystej (DTTnumer 2) N =256, k min =63, k max =126, L=15 (linia z kó łeczkami) w po-równaniu do charakterystyki referencyjnego ltru FIR DFT (cien-ka linia bez markerów)

Fig. 7. The band-reject lter characteristic resulting from the de-scribed windowing technique for the DCT-II-even (DTT number 2)N =256, k min =63, k max =126, L=15 (line with dot markers) comparedto the reference FIR DFT lter characteristic (the thin line withoutmarkers)

Rys. 7. Charakterystyka ltru pasmowozaporowego otrzymanaza pomoc ą opisanej metody okna dla DCT-II-parzystej (DTT nu-mer 2) N =256, k min =63, k max =126, L=15 (linia z kó łeczkami) w po-równaniu do charakterystyki referencyjnego ltru FIR DFT (cien-ka linia bez markerów)

Page 50: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 50/156

ELEKTRONIKA 3/201048

Fig. 8. DCT-II-even based low-pass lter characteristics for xedpass-band P= 31 but varying window length L, indices k =0,1,..., N –1 refer to the transform domainRys. 8. Charakterystyki dolnoprzepustowego ltru bazuj ą cegona DCT-II-parzystej przy sta łym pa śmie przepustowym P= 31 alezmiennej d ługo ści okna L, indeksy k =0,1,..., N –1 odnosz ą si ę dodziedziny transformaty

Fig. 9. DCT-II-even based low-pass lter characteristics for xed window length L=11 but varying pass-band size P , indicesk =0,1,..., N –1 refer to the transform domainRys. 9. Charakterystyki dolnoprzepustowego ltru bazuj ą cegona DCT-II-parzystej przy sta łej d ługo ści okna L=11 ale zmiennejszeroko ści pasma przepustowego P , indeksy k =0,1,..., N –1 odno-sz ą si ę do dziedziny transformaty

Fig. 10. RMSE values of frequency characteristics of the DFT-

based low-pass lter resulting from the windowing technique forvarying P and L, N =64Rys. 10. Warto ści RMSE charakterystyk cz ęstotliwo ściowychdolnoprzepustowego ltru bazuj ą cego na DFT dla zmiennych P i L, N =64

Fig. 11. RMSE values of frequency characteristics of the DCT-II-even based low-pass lter resulting from the windowing techni-que for varying P and L, N =64Rys. 11. Warto ści RMSE charakterystyk cz ęstotliwo ściowychdolnoprzepustowego ltru bazuj ą cego na DCT-II-parzystej dlazmiennych P i L, N =64

Fig. 12. Relative differences (expressed in%) between the RMSEvalues depicted in Fig. 11 and those in Fig. 10 with reference toRMSE values in Fig. 10Fig. 12. Wzgl ędne ró żnice (wyra żone w%) mi ędzy warto ściamiRMSE pokazanymi na rys. 11 i rys. 10 w odniesieniu do warto ściRMSE z rys. 10

L=15) characteristic in comparison to the reference DFT-ba-sed FIR lter characteristic is presented. The DCT-II-even hasbeen selected as the basis for the designed lter as the mostcommonly used representative of the DTT family. Fig. 3 andFig. 4 contain similar comparison for a slightly simpler low-pass lter ( N =64, P =33, L=13) for all DCTs and DSTs, respec-tively, i.e. for the whole set of DTTs.

The presented similarity has been observed for all otherconducted experiments, thus the remaining examples are pro-vided only for the DCT-II-even. Therefore, in Fig. 5 , Fig. 6 andFig. 7 examples for the other basic lter types, namely: high-pass, band-pass, and band-reject lters, respectively, are pre-sented. Fig. 8 and Fig. 9 show results of varying the selected lter parameter – either L or P, respectively, indicating that theobtained lters agree with an intuition trained with the DFT-based FIR lters. For additional study some other examples

for the low-pass lters may be found in [5].Finally, the root mean square error (RMSE) measure was

applied to quantitatively compare the distortions introduced bythe windowing technique to the transform domain lter cha-

Page 51: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 51/156

ELEKTRONIKA 3/2010 49

racteristics. In each test the RMSE was computed comparingthe ideal and the distorted characteristic. With gradually vary-ing bandwidth P and window length L a matrix of the RMSEvalues was obtained for the DFT-based FIR low-pass lter,see Fig.10 , and for the DCT-II-even – c.f. Fig. 11 . In Fig. 12 both matrices are compared taking the results obtained for theDFT as reference. Note, that the results indicate very similarchanges in the RMSE values for both transforms.

Concluding remarksThe presented examples convincingly con rm that the pro-posed approach to the ltering based on lters de ned in thedomains of DTTs should create similar phenomena as in thecase of the FIR ltering and the DFT. Therefore they may beinvestigated, developed, and applied in the similar way andfor similar applications. This observation should encourageresearchers for further examination of this problem towardsnon-rectangular windows and the possibility of simpli cationof the lter coef cients. Hence DTT-based digital lters wouldbe even more similar to the classical FIR lters while keepingadvantages coming from the use of the DTTs e.g. their do-

ubled frequency resolution.

References

[1] Britanak V., Yip P., Rao K.R.: Discrete Cosine and Sine Trans-forms – General Properties, Fast Algorithms and Integer Approxi-mations. Elsevier, Academic Press, 2007.

[2] Korohoda P., D ą browski A.: Digital ltering by discrete trigono-metric transforms realized with generalized convolution. Elektro-nika, vol. 4, pp. 95-9, 2008.

[3] Korohoda P., D ą browski A.: Generalized convolution for extrac-tion of image features in the primary domain. Machine Graphics& Vision, vol. 17, no. 3 pp. 279-297, 2008.

[4] Korohoda P., D ą browski A.: Generalized convolution as a toolfor the multi-dimensional ltering task. Multidimensional Systemsand Signal Processing, vol. 19, pp. 361-377, 2008.

[5] Korohoda P., D ą browski A.: Low-pass ltering with lters de nedin the discrete trigonometric transform domain. Signal Process-ing – Algorithms, Architectures, Arrangements, and Applications

– SPA 2009, (Pozna ń , Poland), pp. 66-69, 2009.[6] Martucci SA: Symmetric convolution and the discrete sine and

cosine transforms. IEEE Transactions on Sinal Processing,vol. 42, no. 5, pp. 1038-1051, 1994.

[7] Martucci SA: Image resizing in the discrete sine and cosinedomain. Proceedings of the IEEE ICIP, vol. 2, pp. 244-247,Oct. 1995.

[8] Mitra S.K.: Digital Signal Processing: A Computer Based Ap-proach. McGraw-Hill, 1998.

[9] Park Y.S., Park H.W.: Design and analysis of an image resiz-

ing lter in the block-DCT domain. IEEE Transactions on CircuitsSystems and Video Technology, vol. 14, pp. 274-279, 2004.

In the close future, one may easily imagine that a monitorscreen presenting information in a public space, requiringinteraction to be handled properly, while no buttons or com-puter mouse are available will be a typical way of human-machine interaction. As an example of such devices touchscreen viewers in photo laboratories can be given, wherecustomers can choose photos to be printed or touch screeninformation points. An advantage of using such a way of hu-man-machine interaction in such places over using computermouse is undeniable but frequent screen cleaning remainsindispensable. In the paper a system overcoming this draw-back, owing to its touchless operating mode, is presented.This article is an extended version of the work originally pre-sented at the SPA conference [9].

* Research funded within the project No. POIG.01.03.01-22-017/08,entitled „Elaboration of a series of multimodal interfaces and their im-

plementation to educational, medical, security and industrial applica-tions”. The project is subsidized by the European regional develop-ment fund of the and by the Polish State budget. Presented Systemand the method of controlling computer by gestures is a Polish patentwith number P.390165.

Gesture recognition methods

Gesture recognition is a complex problem requiring mathe-matical modeling and arti cial intelligence methods. The mat-hematical modeling methods can be divided into two groupsdepending on static or dynamic gesture handling. In the staticmode different shapes formed of palm and ngers positioningare to be recognized, while in the dynamic gestures mode,hand movement interpreting is the problem to be solved.

Among the rst group methods one can mention edge direc-tion histograms [1, 10], elastic graphs [4, 12, 21], active con-tours [14, 15], or deformable templates [18]. All these methodsare used for palm mathematical modeling. Among methodsof the second approach (i.e. dynamic mode) Hidden MarkovModels [6], Kalman lters [2, 13, 16, 17, 19], Volterra lters [3,8], Dynamic Time Warping [5, 7, 20] or molecular lters canbe exempli ed. The system described in the paper bases onthe dynamic gestures, thus herein only examples of methods

of the second group will be shortly reviewed.Typical methods of dynamic systems modeling are probabi-

listic models based on conditional probabilities utilizing discre-te state values. As a common example Hidden Markov Models

Gesture-based computer control system *

(System sterowania komputerem za pomoc ą gestów)

M.Sc, Eng. MICHA Ł LECH, Prof., D.Sc., Eng. BO ŻENA KOSTEK,prof., D.Sc., Eng. ANDRZEJ CZY ŻEWSKI, Ph.D., Eng. PIOTR ODYA

Gdansk University of Technology, Multimedia Systems Dept., Gdansk

Page 52: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 52/156

ELEKTRONIKA 3/201050

can be mentioned. The model is described by probability distri-bution of state transitions, probability distribution of observa-tions in states and initial state distributions. Information aboutthe state is not known (is hidden ). Only the probability functionassigned to the state is given. For each dynamic gesture a se-parate Hidden Markov Model is created. Gesture recognitionis based on estimating the probability with which the observedsequence can be represented by a particular model [6].

A problem of an effective object (e.g. hand) tracking occurs

while designing the system of dynamic gesture recognition.This task can be performed using Kalman lters. The Kalman lter enables to determine the most probable value of the par-ticular parameter of an object, such as velocity or position,considering a number of observations of tracked object. Theassumptions are: the state of an object in time t i +1 is linearlyassociated with state in time t i and the First Order Markov crite-rion is met. These constraints have no effect on the method ofmolecular lters, in which probability distributions are approxi-mated using clouds of weighted particles [2, 13, 16, 17, 19].

The system hardware and the controllingmethod

The presented technology of controlling computer applica-tions by gestures is constituted of the following equipment:multimedia projector, camera, screen for projected image andPC. The projector is hung under the ceiling and the camera ismounted directly below or on the projector with whole area ofthe screen visible in the eld of view of the lens.

The user in such a con guration is located on the line proje-ction between a projector and a screen. Controlling is based onthe recognition of basic hand gestures, e.g. moving hand to theleft side, or on the detection of complex gestures consisting ofa few basic ones, e.g. moving left hand and then right (Fig. 1).

A detailed description of the basic and complex gesture set isgiven in the next chapter.

Set of gestures

The basic and exemplary complex gestures mentioned beforeare presented respectively in Tables 1 and 2. Each gesturerecognized by the system is interpreted as the system eventemulation. Each gesture can be activated or deactivated bythe system user in the graphical interface gesture panel.Deactivating gestures that are not useful in particular workincreases recognition reliability, since the smaller the set ofgestures, the smaller the risk of the wrong recognition. Also,the default action can be changed by assigning new eventto emulate.

Tabl. 1. Set of basic gesturesTab. 1. Zestaw podstawowych gestów

Gesture Emulated event Default action

moving hand left (or bothhands)

key ← pressing showing previousimage or presen-tation slide/movingobject

moving hand right (orboth hands)

key → p ressing showing next ima-ge or presentationslide/moving object

moving hand up (or bothhands)

key ↑ p ressing showing previousimage or presen-tation slide/movingobject

moving hand down (orboth hands)

key ↓ pressing showing next ima-ge or presentationslide/moving object

moving hands towardeach other

key ‘+’ pressing zooming out

moving hands apart key ‘-‘ pressing zooming in

left hand up and righthand down

key ‘r’ pressing rotating right

right hand up and lefthand down

key ‘l’ pressing rotating lef t

keeping one hand steady clicking/choosingan object

clicking/choosingan object

keeping both handssteady

idleness no action

Fig. 1. A way of using the engineered systemRys. 1. Sposób pracy z systemem

Fig. 2. An optional way of using the engineered system whenhandling with multimedia presentationsRys. 2. Opcjonalny sposób sterowania systemem w przypadkuprowadzenia prezentacji multimedialnych

When using the system for presentation purposes, i.e.with multimedia presentation viewers the content projected onthe screen could be obscured by the user and not completelyseen by the audience. For this reason, optionally it is possibleto use a second camera near the left or right side of the scre-en angled 90 degrees toward the ceiling camera–screen line.The user is standing at a close distance to the screen andmakes gestures towards camera lens (Fig. 2). Controlling is

based on recognizing the same set of hand movements as inthe previous con guration. For instance, moving hand fromthe right to the left side results in showing previous slide andfrom the left to the right side – next slide.

Page 53: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 53/156

ELEKTRONIKA 3/2010 51

Tabl. 2. Set of complex gesturesTab. 2. Zestaw gestów z łożonych

Gesture Default action

moving hand left/right/up/down two times no assigned action

keeping hand steady for a while (3 gestu-re recognition iterations)

clicking/choosing anobject

drawing ‘+’ sign closing an application

Keeping both hands steady for a while (3gesture recognition iterations)

no complex action

While analyzing Fig. 3 , one can notice that the system workcycle has been divided into three phases. The rst one re-gards the calibration operations (A), both manual, performedby the user and automatic, based on the user’s indications.One of tasks of this phase is to determine the effective area(1) of an image grabbed from the camera mounted on theceiling projector. This area, regarded as a view of the imagedisplayed by the projector, is determined by the user pointingpositions of desktop corners in the frame ( Fig. 4 ).

Fig. 3. Block diagram of the gesture-based computer control systemRys. 3. Schemat blokowy systemu sterowania komputerem zapomoc ą gestów

The system software

A software for the system runs as a background thread ableto control any top-most computer application. The system canbe especially useful with images and multimedia presenta-tions viewing.

The interface has been implemented in Java languageusing object programming paradigms. The choice of this par-

ticular language and the platform was due to the presenceof various image capturing and processing libraries on LGPLlicense, which can easily be adopted to the speci c environ-ment.

In Fig. 3 a block diagram of the architecture of the Gesture-based Computer Control System is presented.

Fig. 4. Determining effective area of an image grabbed from thecamera placed under the projector Fig. 4. Okre ś lanie obszaru efektywnego w obrazie pozyskanymz kamery zintegrowanej z rzutnikiem

Basing on these positions, scaling of the projected imageis performed (4) in such a way, that this image and the imagegrabbed from the camera should have identical dimensions.To ensure this, basing on these values, perspective correction(3) is performed. Optionally, also the color calibration (2) canbe performed. The aim of this process is to set optimal valuesof the image processing parameters to provide the color si-milarity between frames of the camera video stream and theimages displayed by the projector. Such a calibration reducesan impact of light conditions and distortion introduced by thecamera lens, such as vignetting. During the calibration pro-cess 5 solid colored images (red, green, blue, white, black)are displayed. Basing on the result of subtraction of each dis-played image and respective camera frame, tables of discreteconstant values l c i are created. Each table contains integervalues of range [-255, 255] associated with each pixel of thedisplayed solid color image, which are being used during ima-ge processing in the phase described below.

The second phase (B) is responsible for gesture detec-tion. The frames obtained from the camera after perspectivetransformation are subtracted from the scaled projected ima-ges (5). The subtraction order can be changed by the user inthe interface option window. As default, RGB subtracting isperformed using green component only. The user can chooseother components or activate subtracting using all RGB com-ponents when working in speci c conditions. The subtractionis performed according to the following formula:

(1)

where o equals 1 or -1 and designates subtracting order, c i 1

designates value of chosen i-pixel component (R, G, B, all

components) of the projected image, c i 2 is a value of choseni-pixel component of the image grabbed from the camera andl c i designates color compensation constant. The color com-pensation constant is retrieved from the respective table LC ,

( )ic

ii l ccoi +−= 21 , cic Ll

Page 54: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 54/156

ELEKTRONIKA 3/201052

created during calibration phase, basing on the amount ofparticular color component in the image obtained from thecamera. The value i determines the value of the pixel in theresulting image or when using thresholding operation, is beingcompared with the threshold T. The value of the pixel is thenset according to a very simple condition:

(2)

As default, binarization with threshold T is used. After sub-traction, the image is median ltered (6) with square maskof size equal 9. The system is designed in such a way that itenables more than one user to control the computer applica-tion simultaneously. Therefore, the obtained image is dividedinto a few vertical parts of a number which is equal to thenumber of hands used for controlling. However, the currentversion was examined with one person only. In this particularcase, in two vertical halves of the image, separately left andright hand is searched (7). The presence of the hand in theparticular area is determined by the presence of the numberof neighboring pixels other than (0, 0, 0) in the RGB palette.

The default recognition threshold is the area of 5x5 pixels ofthe color value above the threshold T .Collecting hand positions (8) and designating motion ve-

locity vectors enable to determine the gesture performed (9).Gathering information about the sequence of basic gestures(10) gives possibility of creating and recognizing complex ge-stures. In the last phase (C), called executive phase, an ope-ration assigned to particular gesture is performed (11).

The system has been tested with a typical image viewer.The set of default images contained in Microsoft Windows Vi-sta was used. The reliability, regarded as the ratio betweenproperly recognized gestures and all gestures, was approx.90%. Worth noticing is the fact that improper recognition wasmainly the effect of performing two gestures, one instantly af-ter another. In fact, after recognizing a gesture, 2-second pau-se during which no actions are recognized is introduced in thesystem. Such a pause is a temporary solution for the problemof lack of perfect synchronization between processes of grab-bing images from the camera and retrieving correspondingprojected images. Better the synchronization or rememberingabout this 2-second pause while using the system should re-sults in a higher reliability.

Conclusions

The research on computer gesture recognition shows thatcreating effective human-computer interaction interface is acomplex task. Methods used currently in the Gesture-basedComputer Control System enable to recognize simple gestu-res, such as hand motion in left or right direction, especial-ly in speci c circumstances ensuring reliable results. For agesture controlling based on modeling various palm shapesmore sophisticated methods, such as Hidden Markov Models,Kalman and Volterra lters, could be used. On the other hand,taking advantages of too many sophisticated methods in onesystem can lead to unacceptable latency problems, makingthe interface ineffective and dif cult to control.

Analyzing speci city of using gestures as a mean to con-trol a computer and considering possibilities created owing tothis particular way of human-computer interaction method one

can notice that world widespread method of working with com-puter basing on window interface designed according to themouse handling is not necessarily the most ergonomic one.Therefore, developing an effective and reliable technology of

T i

T i

ii ≥

<= 0

the computer controlling using gestures should include desig-ning a new, from the point of view of the user, type of an inter-face, eliminating the presence of a cursor on a screen.

As mentioned earlier, due to emulating events associa-ted with key or mouse pressing, the system can be usedwith any computer application active in a particular moment.However, for presentation purposes the application calledInteractive Blackboard has been developed. The applicationinteracts with the Gesture-based Computer Control System

and is controlled by its gesture set. Using the InteractiveBlackboard the user has a possibility of drawing shapes to-uchless on the virtual blackboard displayed by the multime-dia projector.

The system presented in the paper and the method ofcontrolling computer by gestures is a Polish patent numberedP.390165.

References

[1] Birk J., Kelley R., Chen N., Wilson L.: Image Feature ExtractionUsing Diameter-Limited Gradient Direction Histograms . Pattern

Analysis and Machine Intelligence. IEEE Transactions on , Vol.PAMI-1, Issue 2 , April 1979, pp. 228-235.

[2] Clipp B., Welch G., Frahm J., Pollefeys M.: Structure FromMotion via a Two-Stage Pipeline of Extended Kalman FiltersProceedings of the British Machine Vision Conference (BMVC2007), September 10-13 2007.

[3] Dayong Zhou, DeBrunner V.E.: Ef cient adaptive Volterra ltersfor active nonlinear noise control with a linear secondary-pathCircuits and Systems, 2004. ISCAS ‘04. Proceedings of the2004 International Symposium on , vol. 3, 23-26 May 2004, pp.III - 299-300.

[4] Da-Rui Sun; Le-Nan Wu: A local-to-holistic face recognition ap-proach using elastic graph matching Machine Learning and Cy-bernetics, 2002. Proceedings. 2002 International Conference on ,vol. 1, 4-5 Nov. 2002, pp. 240-242.

[5] Giorgino T., Tormene P., Quaglini S.: A Multivariate Time-WarpingBased Classi er for Gesture Recognition with Wearable StrainSensors. Engineering in Medicine and Biology Society, 2007.EMBS 2007. 29th Annual International Conference of the IEEE ,

26 Aug. 2007, 22 - pp. 4903-4906. [6] Morguet P., Lang M.: Spotting dynamic hand gestures in

video image sequences using hidden Markov models,Image Processing, 1998. ICIP 98. Proceedings. 1998 Interna-tional Conference on , 4-7 Oct. 1998, vol. 3, pp. 193-197.

[7] Muscillo R., Conforto S., Schmid M., Caselli P., D’Alessio T.:Classi cation of Motor Activities through Derivative DynamicTime Warping applied on Accelerometer Data. Engineeringin Medicine and Biology Society, 2007. EMBS 2007. 29th An-nual International Conference of the IEEE , 22-26 Aug. 2007,pp. 4930-4933.

[8] Kenji Nakayama, Akihiro Hirano, Hiroaki Kashimoto: A LatticePredictor Based Adaptive Volterra Filter And a SynchronizedLearning Algorithm, XII European Signal Processing Confer-ence, Vienna, 2004.

[9] Lech M., Kostek B., Czyzewski A., Odya P.: Gesture Recognition

Framework for Multimedia Content Viewer Controlling ., Proceed-ings of the 13 th IEEE SPA conference on Signal Processing – Al-gorithms, Architectures, Arrangements, and Applications, 2009.

[10] Pinheiro, A.M.G.: Image Description Using Scale-Space EdgePixel Directions Histogram , Semantic Media Adaptation andPersonalization, Second International Workshop on , 17-18 Dec.2007, pp. 211-218.

[11] Qiuyu Zhang, Fan Chen, Xinwen Liu: Hand Gesture Detectionand Segmentation Based on Difference Background Image withComplex Background , Embedded Software and Systems, 2008.ICESS ‘08. International Conference on , 29-31 July 2008, pp.338-343.

[12] Stamou G.N., Nikolaidis, Pitas I.: Object tracking based on mor-phological elastic graph matching , Image Processing, 2005.ICIP 2005. IEEE International Conference on , vol. 1, 11-14 Sept.2005, pp. I - 709-12.

[13] St-Pierre M., Gingras D.: Comparison between the unscentedKalman lter and the extended Kalman lter for the position es-timation module of an integrated navigation information system,Intelligent Vehicles Symposium, 2004 IEEE , 14-17 June 2004,pp. 831-835.

Page 55: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 55/156

ELEKTRONIKA 3/2010 53

[14] Sundaramoorthi G., Jackson J.D., Yezzi A., Mennucci A.C.:Tracking With Sobolev Active Contours, Computer Vision andPattern Recognition, 2006 IEEE Computer Society Conferenceon , Volume 1, 17-22 June 2006, pp. 674-680.

[15] Sundaramoorthi G., Yezzi A., Mennucci A.C.: Coarse-to-FineSegmentation and Tracking Using Sobolev Active Contours , Pat-tern Analysis and Machine Intelligence, IEEE Transactions on ,vol. 30, Issue 5 , May 2008, pp. 851-864.

[16] Welch G.: HISTORY: The Use of the Kalman Filter for HumanMotion Tracking in Virtual Reality, Presence: Teleoperators andVirtual Environments, 18(1), 2009.

[17] Welch G., Bishop G.: An Introduction to the Kalman Filter , SIG-GRAPH 2001 course 8. In Computer Graphics, Annual Confer-ence on Computer Graphics & Interactive Techniques, ACMPress, August 12-17 2001.

[18] Xun Wang, Lei He, Yingjie Tang, Wee W.G.: A divide and con-quer deformable contour method with a model based searchingalgorithm , Systems, Man, and Cybernetics, Part B, IEEE Trans-actions on , vol. 33, Issue 5 , Oct. 2003, pp. 738-751

[19] Yang H., Welch G.: Model-Based 3D Object Tracking Usingan Extended-Extended Kalman Filter and Graphics RenderedMeasurements. in Proceedings of 1st Computer Vision for Inter-active and Intelligent Environments (CV4IIE) workshop, 2005

[20] Yaniv R., Burshtein D.: An enhanced dynamic time warpingmodel for improved estimation of DTW parameters . Speech and

Audio Processing, IEEE Transactions on , vol. 11, Issue 3 , May

2003, pp. 216-228.[21] Zafeiriou S., Tefas A., Pitas I.: Advances in Elastic Graph Match-ing for Frontal Face Veri cation . Computational Intelligence inImage and Signal Processing, 2007. CIISP 2007. IEEE Sympo-sium on , 1-5 April 2007, pp. 319-324.

Matlab/Simulink environment is equipped with complex Videoand Image Processing Blockset [1]. A model of video proces-sing designed in Simulink can be veri ed practically in real-time using a PC computer. We can also run Simulink videomodel using a DSP platform (e.g., DM6437 [2]). This possi-bility offers Target Support Package TC6 [3], which includesspecialized blocks for C6000 processors from Texas Instru-ments e.g.:• DM6437 EVM Board Support – video capture and display,

on screen display (OSD), LED and DIP maintenance,• C64x DSP Library – data conversion, ltering, mathemati-

cal operations, transforms,• C6000 DSP Communication Library – UDP and TCP/IP

communications• C6000 DSP Core Support – memory and task manage-

ment.We have used the Target Support Package TC6 with Si-

mulink, Real-Time Workshop and Embedded IDE Link CC (forCode Composer Studio from Texas Instruments [4]) as a set oftools for fast design and test DSP based embedded system.

In Section 2 we describe basic aspects of Simulink modelfor people tracking. Section 3 presents realization and tests ofthis task with DSP module DM6437 EVM.

Object tracing using Simulink modelsPeople tracking model Video and Image Processing Blockset includes above 40 ex-

perimental software examples. Among them one of the mostinteresting is People Tracking . An original scheme, which pro-cesses a video sequence from the input le, was modi ed bythe authors as it is shown in Fig. 1 . The new scheme uses an

input signal acquired from the web camera using From VideoDevice block. Then the original RGB color space is convertedinto intensity.

The proposed tracking model is based on processingof a video sequence using fast difference method and blobanalysis [5]. Background representation is calculated usinga number of rst (e.g. twenty) input frames (de ned by N-Sample Enable ) kept the unchanged until the end of the tra-cking process.

In order to improve the tracking results, binary differentialimage is morphologically dilated. A moving object is detectedand tracked in a sequence of frames using detection coor-dinates. Further improvement is achieved with application ofthe auto-threshold in the segmentation block. Auto-thresholdmechanism uses histogram of the input image.

The model People Tracking can be manually adjustedusing the following parameters ( Edit Parameters ):• Segmentation threshold scale – accuracy of the object

marking in the image,• Box merging thresholds – maximum distance thresholds

between areas identi ed as one object; represented as a2-element vector of vertical and horizontal distances givenin pixels,

• Target tracking threshold – maximum distance of objectdislocation between two consecutive frames (value givenin pixels).The listed parameters should be adjusted according to the

distance between the camera and the observed scene.

Output data from the blob analysis (position and size) areprocessed using the Kalman lter. Next, using blocks DrawRectangles and Insert Text , moving objects in the output videoare marked with rectangles and letter identi ers.

Selection of tracking model parametersin embedded video system

(Dobór parametrów modelu ś ledzenia we wbudowanym systemie wideo)

dr in ż. TOMASZ MARCINIAK, mgr in ż. DAMIAN JACKOWSKI, dr in ż. PAWE Ł PAW ŁOWSKI,prof. dr hab. in ż. ADAM D Ą BROWSKI

Politechnika Pozna ńska, Katedra Sterowania i In żynierii Systemów,Pracownia Przetwarzania Sygna łów i Uk ładów Elektronicznych

Page 56: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 56/156

ELEKTRONIKA 3/201054

It can be observed [6], that the applied algorithm even withluminance normalization and auto-threshold, may not give pro-per results in cases of rapid changes of global image parame-ters (e.g., unexpected illumination changes) and/or quickly mo-ving objects within frame (camera moves or scene changes).

Continuous background estimation

It is obvious that the basic Poeple Tracking model should bemodi ed by adding continuous background estimation. The

background is calculated taking current and previous inputframes into consideration. The frames are stored in temporarybuffer, which is used for median ltering. The size of tempo-rary buffer signi cantly affects speed of the processing time,

Fig. 2. Calculations for background estimationRys. 2. Obliczenia estymacji t ła

Fig. 1. Modi ed People Tracking model. Rys. 1. Zmody kowany model People Tracking

Fig. 4. People Tracking model for DM6437 EVM. Rys. 4. Model People Tracking dla modu łu DM6437

thus after tests we have decided that the number of the analy-zed frames should be set to 20.

The background estimation in Simulink environment canbe realized with ready-to-use blocks like Temporal MedianEstimator , Temporal Median or we can built unaided model(cf., Fig. 2 ).

Page 57: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 57/156

ELEKTRONIKA 3/2010 55

This solution requires conversion of two-dimensional fra-mes into vectors, while after the median calculation an opposi-te conversion into one frame using Reshape block is needed.

Next problem, which has to be overcome, is a situationwhen the moving object is stopped. In this case the objectcan be classi ed as a background. A simple solution of thisproblem is shown in Fig. 2 .

Marking of moving objects by drawing rectangles can berealized using Draw Rectangles block from Target SupportPackage TC6 [3]. This block con gures directly Video Proces-sing Back End (VPBE) registers [8] using On Screen Display(OSD) module.

A potential disadvantage of this solution consists in therestriction that one object only can be marked in the image.Relatively slow processing time does not give any possibilityof fast multiplexing between several marking rectangles.

For this reason we use blocks from Image and Video Pro-cessing library. This solution makes it possible to insert seve-ral rectangles and perform many captions in the same time inthe output image. Additional possibility is putting any variable(e.g., a number of detected objects) using Text and Add Fra-me Label blocks (cf., Fig. 6 ). In our solution the number ofdetected objects is shown in the left upper corner of the outputimage. Second variable showed in the output video sequen-ce is the number of the processed frames. On this basis thespeed of the processed frames (FPS – frame per second) canbe calculated.

Fig. 3. Modi ed background estimationRys. 3. Zmody kowana estymacja t ła

After initialization using 20 input frames (de ned by N-

Sample Enable block) and fully loading temporary buffer, thisbuffer is also loaded by frames from Compositing block. Thisblock gives possibility of connection of two images with thede ned mask. In the case of an appearance of objects notbelonging to the background, the Composing block connectscurrent frames with the areas of background representationcalculated before the object appears. The output binary maskis delayed using Delay block and is the mask in the calculationprocess of the background estimation.

Before the composing process, an additional morphologi-cal closing is carried out in order to improve the output binarymask.

Realization of detection and tracking usingDM6437 EVMDM6437 based model for people tracing

Detection and tracking was realized as an embedded systemusing EVM card with DM6437 signal processor (cf., Figs 4and 5 ). Input video signal from PAL camera is acquired byhardware video decoder TVP5146 [7]. This stage of proces-sing is realized by DM6437EVM Video Capture and C6000Deinterleave blocks in Simulink model. Output video signalwith marked objects (people) is showed on the TV monitor.The whole proposed and analyzed model is shown in Fig. 4.

Fig. 5. Elements of hardware realizationRys. 5. Elementy sprz ętowe systemu

Fig. 6. Example screenshot with marked objectsRys. 6. Przyk ładowy zrzut ekranu z zaznaczonymi obiektami

During software tests it has been observed that the lib-raries Target Support Package TC6 and Video and ImageProcessing are not fully compatible. Captions presentation isinterchanged (like transpose matrix) in each of libraries. Thisproblem can be solved by three step operation: transpositionof image matrix, inserting the text, and repeated transposition.The solution is simple but computationally ineffective for thewhole tracking process, Thus currently we display variables inthe transpose form, still waiting for compatible libraries fromMathworks.

Tests of achievable frame rates

We have started tests of the proposed model with the analysisof the in uence of the data type to the speed of processing.Two cases were tested: xed point data representation andoating point data representation. Although the Code Com-poser Studio automatically realizes optimization we receiveddifferent results for the FPS (frames per second) rate:• 8,05 FPS for the oating-point data• 10,05 FPS for the xed-point data.

Thus this test shows that the proper de nition of the datatype ( xed-point data) accelerates the processing speed byabout 20%. All data of images should be represented in uint8format and then processed in int16 or int32 formats.

Page 58: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 58/156

ELEKTRONIKA 3/201056

The next test concerned search of the maximum availableframe rate of the input video sequence. We have assumedacquiring images with rates: 1, 5, 10, 15, 20, 25 FPS but alsowith the controlling parameter equal to „–1”, which means theautomatically selected nearly maximum speed of the VideoCapture block.

It has been observed that the maximum speed of proces-sing is 10 FPS. Using the automatically selected rate with „–1”parameter was ineffective, as it reduced the frame rate down

to 5 FPS.In the following test the size of the processed image andthe scaling method and their in uence on the available framerate were analyzed. Five scaling methods were tested: noscaling, using the Resize block in the Nearest Neighbour con gurations, Bilinear or, Gaussian pyramid, and two simpletechniques, which leave columns and rows with the steps of:5 or 10 pixels. Results of the achieved frame rates are givenin Table 1 .

Very time-consuming process is continuous backgroundestimation and Kalman ltering. Four possibilities were tested(Table 2 ). The continuous background estimation reducesthe speed by about 45% in relation to the case without back-

ground estimation. Additional Kalman

ltering does not affectsigni cantly the rate reduction, even if realized with the oatingpoint data representation. However it has been observed thatin some cases Kalman ltering, instead of improving the qual-ity of tracking, causes wrong decisions, resulting in markedrectangles jumps in the output image.

Fig. 7. LED signaling of detected moving objectsRys. 7. Sygnalizacja LED detekcji obiektu ruchomego

Finally, in Table 3 an in uence of three additional algo-rithm modi cations on the frame rate, are compared. Theanalyzed options are: output results in color, additionalLED signaling on the EVM board (cf., left upper corner ofDM6437 module in Fig. 7 ), and application of modi ed con-tinuous background estimation in Fig. 3 . Although color pre-sentation of processing results is user-friendly, the resultingframe rate is very low. On the other hand the LED signalingcost is very low and its activation is interesting to indicate

if the de ned moving part of the image exceeds the wholeimage. Modi ed and more functional effective backgroundestimation operates with a comparable frame rate to that ofthe standard estimation.

Tabl. 1. In uence of scaling methodTab. 1. Wp ływ metody skalowania

Type of scalingPercent of

analyzed inputimage

ObtainedFPS

No scaling 100% 3.9

Nearest Neighbour Resize 4% 4.5

Gaussian Pyramid level 2 6.25% 6.7

Columns-rows remove with stepsof: 5 pixels 4% 10.3

Columns-rows remove with steps10 pixels

1% 12.0

Tabl. 2. Analysis of cost of continuous background estimation and ofKalman lteringTab. 2. Analiza wyp ływu ci ą głej estymacji t ła oraz ltracji Kalmana

Kalman ltering Backgroundestimation

Output FPS

× × 8.15

× 8.05

× 4.55

4.50

Tabl. 3. Analysis of cost of additional operationsTab. 3. Wp ływ dodatkowych operacji

Type of option FPS Number ofcode lines

Color presentations of results (withoutbackground estimation)

2.55 3900

Additional LED signaling (without back-ground estimation)

8.05 3790

Continuous background estimation tak-ing detected objects into considerations

4.45 4005

Conclusions

Effectiveness of people tracking using the embedded systemwith the DM6437 signal processor has been analyzed andcon rmed. The presented solution makes it possible to trans-fer only important parts of images for further processing e.g.for face recognition. Reduction of the amount of the transferreddata can be important in video monitoring system, which canbe realized with wireless technology. Currently our system isalso equipped with GSM terminal, which gives the possibility ofsending emergency messages using SMS techniques [9].

Realization of people tracking using Matlab/Simulink envi-ronment makes fast implementation, modi cation, and testingpossible. Presented models designed for the real-time proces-sing are appropriate for signal processor realization using e.g.the DM6437 Texas Instruments DSP platform [9, 10]. The de-signer does not need to know the details of programming theDSP module with the Code Composer Studio environment.

At the same time it can be observed that programming ofthe DM6437 using Matlab/Simulink results with very ef cientworking output code. The received frame rate up to 10 FPS isnot amazing but comparable with other solutions (cf. [11]).

Another disadvantage of this type of programming is a li-mited number of the Simulink blocks, which are ready to use.

Furthermore from the Matlab environment level we cannot ac-cess any con guration register [6].

This work was supported by INDECT and 93-182/10 DS projects.

Page 59: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 59/156

ELEKTRONIKA 3/2010 57

References [1] Video and Image Processing Blockset™ 2 User’s Guide, The

MathWorks, Inc., 2009. [2] TMS320DM6437 DVDP Getting Started Guide, Texas Instru-

ments, 2007. [3] Target Support Package™ TC6 3 User’s Guide, The MathWorks,

Inc., 2009. [4] Code Composer Studio Development Tools v3.3 Getting Started

Guide, Texas Instruments, 2006. [5] Antonakos J.: Image Processing Fundamentals. Circuit Cellar,

12/2001. [6] Jackowski D.: Detekcja i śledzenie obiektów w sekwencjach

wideo z wykorzystaniem modu łu DM6437 DVDP. Praca magis-terska, Politechnika Pozna ńska, 2009.

[7] TVP5156 Data Manual, Texas Instruments, 2008. [8] TMS320DM643x DMP Video Processing Back End (VPBE)Texas

Instruments, 2007. [9] Cinterion TC35i Terminal, Hardware Interface Description v.

03.01, 12/2005.[10] Xu Z.: Implementing Video Tracking Systems on DM6437 EVM

Using Matlab and Simulink. Texas Instruments, http://focus.ti.com , 2008.

[11] Kisacanin B.: Embedded Vision Algorithm Design on DM643x . DSP R&D Center, Texas Instruments, 2008.

[12] Illisis Inc.: An introduction to IntelliVIX-SDKfor TI DaVinci DSPs,http://www.illisis.com , 2007.

There are a few methods used to estimate the distance fromthe object in scene. The methods can be divided into pas-sive: i.e. stereovision, depth form focus/defocus and active:the time-of- ight (TOF) method, ultrasound sensor basedmethods and the hybrid techniques for estimating depth whichutilized two or more approaches from the above. The goal ofstereovision is to compute the spatial position of points onthe basis of their image coordinates in two different views,in the aim of either performing measurements or reconstruct-ing the three-dimensional scene structure. Since the camerasare modeled by a central projection, all points positioned ona light ray are projected onto the same pixel [1]. The depthfrom focus [2] idea relies on the principle in which the distanceto one point is determined by taking many images in betterand better focus . In next method called depth from defocus[3], the depth at all points in the scene can be determined bytaking a small number of images under different lens param-eters. The Time-of-Flight (TOF) range sensors use an activetechnique to obtain a near real-time scene depth. The basicprinciple of depth calculation in TOF is based on timing theround-trip of a pulse of light. The TOF sensors are able toproduce a full depth frame simultaneously, therefore allow-ing their application to dynamic scenes [4]. In the ultrasoundmethod , the time of ight of sound is calculated.

Over the last couple of years researchers and engineersput in a signi cant effort to improve and develop applicationsand systems for depth estimation. There is still a lot of scopefor research in order to adapt such systems for use in reallife. 3D information recovery systems can have many appli-cations in the industrial, medical, entertainment or the homeeld i.e. collision avoidance systems for robots or vehicles,computer gaming, supervising manufacturing processes. Themost interesting usages of such systems is navigation. Apartfrom machine navigation the methods and algorithms can be

applied to guiding humans. This is especially useful when tak-ing into consideration the visually impaired or elderly people.The use of such systems in this eld should be very preciseand free of errors as human safety and life is paramount. Eachmethod mentioned above has its restrictions and its usage islimited to the speci c environment and conditions. A compari-son of TOF and stereovision is presented in this paper.

Example systems for 3D reconstructionand distance measurements

Several scene reconstruction systems are available. Themost popular are Bumblebee Stereovision System [5], theSR3000 [6] and 3DV System [7]. There are also prototypesbeing developed by researchers and engineers i.e. theCMOS 3D Camera [8] and a couple of systems combin-ing existing solutions (TOF, ultrasound, sensors) in order toimprove precision, range of usage, and reliability. The twowhich may attract the attention of the reader are the systempresented in [9] and the hybrid described in [10]. The rstsystem combines a stereovision with a ring of ultrasonic so-nars and vehicle odometry (wheel encoders). The combina-tion of these sensors provides a reliable device that can beused for localization and obstacle detection by increasing thequality of information (depth map) available to the operator orsupervising computer. In the second system [6] the SR3000and a pair of stereo cameras are utilized to provide betteraccuracy for depth calculation. The hybrid can be used forany distance and is independent of an outer source of light.

Authors of the system achieved a depth map with absolute

accuracy to about 5 mm over a range of one meter for certainscenes and environment conditions.

There is still a lot of work to be done in order to exploit thepotential of different systems to real-life applications.

Time-of- ight versus stereovision in depth sensingapplications: experimental study

(Porównanie metod czasu przelotu oraz stereowizji do zastosowa ńw systemach rekonstrukcji g łębi sceny trójwymiarowej)

mgr in ż. MARCIN MORA ŃSKI, prof. dr hab. ANDRZEJ MATERKA

Technical University of Lodz, Institute of Electronics, Lodz, Poland

Page 60: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 60/156

ELEKTRONIKA 3/201058

ExperimentsIt is a big challenge to build a depth recovery system that canbe used in every scenario and be a reliable, user friendly, ef-cient, energy saving mobile device. On the market there area couple of 3D retrieval systems and solutions, but they areexpensive and mostly for industrial applications. The methodswhich the systems used are dedicated only to recognizing sur-faces, edges or speci c shapes and cannot be adjusted forother functions. In this publication authors focuses on furtherinvestigating the active method (based on TOF) and stereovi-sion. The main purpose of the research is to nd out if those3D recovery methods can be applied to navigate blind or visu-ally impaired people. Blind pedestrian navigation is one of themain subjects of research being carried out at the Institute ofElectronics at the Technical University of Lodz [11]. The proto-type of the developed system is shown in Fig. 1 .

This part of the indoor tests covered distances between0-1.2 m for two types of plain surface: brown and white. Theresults for the TOF method are shown in Fig. 3 and Fig. 4 .

The research was made for three modulation frequencies19, 20, 30 MHz with maximum scene depths 7.9 m, 7.5 mand 5.0 m respectively. There was a certain distance at whichanything closer to the scene was impossible to measure. Forthe brown background, the minimum distance (camera-scene)

was 40 cm and for the white, equal to 55-60 cm depending onf mod (higher f mod give lower threshold value). Accuracy decrea-ses for shorter distances. It appears that a bright white surfacediffuses the infrared sent by the SR3000 and affects the cal-culation of distance. Readouts varied signi cantly In the caseof short distances.

Fig. 1. The prototype of the independent system for navigationof visually impairedRys. 1. Prototyp niezale żnego systemu wspomagania osób nie-widomych

It is very important to test the system in as many situationsas possible i.e. places, scenes, different environments andlight conditions. This is in order to ensure a reliable and rela-tively independent device. In a prototype it is not so importantto achieve accuracy of millimeters, notwithstanding the sys-tems must be stable and work for every possible distance.

SR3000 camera (for TOF) and Bumblebee StereovisionSystem were used in these tests. The general principle ofdepth estimation in the SR3000 camera is as follows: sinusoi-dally modulated, light wave is emitted and the phase delay be-tween the original and received light signal is exploited for theextraction of the time delay[3]. Modulation frequency (f mod ) maybe chosen from a range of 19 – 30 MHz and the choice de-pends on what distance is interesting for the application at hand (greater f mod means shorter distance but better accuracy).

The Bumblebee camera integrates data from two stereovision cameras into a single coordinate system to build thedepth map of the scene. The test environment and conditionswere designed in a way to provide a precise comparison ofthe tested methods.

The research performed was divided into two groups:• Indoor tests under arti cial light• Outdoor tests under natural light

Image resolutions for the SR3000 and the Bumblebeewere 176 x 144 and 320 x 240 pixels respectively.

The rst group of measurements was performed in a labo-

ratory. The cameras were placed in a special moving holder(Fig. 2 ). The holder was equipped with a distance-meter toolproviding the precise (millimeter accuracy) distance betweenthe camera and the scene.

Fig. 2. Measurement equipment for distance estimation (rangesup to 1.2 m)Rys. 2. Specjalistyczny zestaw umo żliwiaj ą cy pomiary odleg ło-ści (zasi ęg do 1,2 m)

Fig. 3. Depth measurements for the brown smooth sceneRys. 3. Pomiary g łębi g ładkiej br ą zowej sceny

Page 61: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 61/156

Page 62: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 62/156

ELEKTRONIKA 3/201060

The Bumblebee behaves stably outside and the readoutsare the same as inside the building.

Fig. 9. Depth reconstruction for the scene shown in Fig. 8 (TOFmethod)

Rys. 9. Scena z rys. 8 zrekonstruowana przy u życiu metody TOF

Fig. 8. View of the scene reconstructed for distances in range of1 – 5 mRys. 8. Wygl ą d sceny wykorzystywanej do pomiarów odleg ło ściw przedziale 1 – 5 m

ConclusionsThe TOF and Stereovision systems have many advantagesover different 3D recovery systems. For the SR3000 the re-sults are very precise and devoid of errors. Nevertheless,there are a few minor drawbacks that still need to be workedon.

There are dif culties when the scene contains a texturewhich must be reconstructed precisely or some extra detailsare needed (i.e. shapes of objects). The next constraint thatneeds consideration when performing outside operation, are

the outer light conditions. When the sunlight is very bright, itintroduces errors and readouts vary signi cantly and thereforeaffects accuracy . In both situations, a stereovision camera canbe applied. The Bumblebee is able to reconstruct all details

Fig. 10. Depth reconstruction for the scene shown in Fig. 8 (ster-eovision)Rys. 10. Scena z Rys. 8 zrekonstruowana przy u życiu stereowizji

when the scene provided the object is textured and bright sun-light has no effect on its performance.

For both systems problems arise if an object suddenlyappears below the minimum distance of the cameras depthmeasurements range. The drawback of energy consumptionis also prevalent especially considering such system for mo-bile applications.

Comparison of depth sensing methodsPorównanie metod rekonstrukcji g łębi

TOF Stereovision

Additional source of light(during the night)

not required required

Speed of operation anddepth calculation

fast slow

Smooth surfaces(with no texture) applicable not applicable

Accuracy(scene with texture)

couple of cm couple of cm

Susceptible to sunlight susceptible not susceptible

Minimum distance forreliable depth estimation(camera – scene)

40-60 cm(depends f mod )

40 cm

Maximum distance forreliable depth estimation(camera – scene)

8-9 m 10 m

Finally, it appears that the TOF has a couple of advantagesover stereovision. The most important being that data process-ing required for 3D reconstruction is very fast. Furthermore,it does not need texture to operate properly or an externalsource of light for the night/in dimly-lit rooms ( table ). Howevernon-lambertian surface objects may cause problems.

Future work

To improve the readouts, special software algorithms for depthrecovery must be implemented. Each system has some ad-vantages over the other in different ways, so both techniquescould be used in tandem to achieve satisfactory outcome.This could be helpful in situations in which shapes and edges

are important to reconstruct and when we have an externalsource of light towards a reconstructed object. To use theprototype for very short distances, ultrasound sensors seemto be a prospective solution, especially since the rst author

Page 63: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 63/156

ELEKTRONIKA 3/2010 61

has experience with using such techniques [12]. Combiningall these features allow the possibility to build an ef cient andprecise system which can guide the blind independently. Itcan also serve as a supplement for the system which is cur-rently being developed by the authors and described in [13].

This work has been supported by the Ministry of Education andScience of Poland grant no. R02 01303 in years 2007–2010.

References [1] Pierre Charbonier, Valérie Muzet, Philippe Nicolle, Nicolas Hau-

tiere, Jean-Philippe Tarel: Stereovision applied to road sceneanalysis. LCPC, France, February 2009.

[2] Ens John, Lawrence Peter: An investigation of methods for de-termining depth from focus. IEEE Transactions on Pattern Analy-sis and Machine Intelligence, Vol 15. No. 2. February 1993.

[3] Yoav Y. Schechner, Nahum Kiryati: Depth from Defocus vs. Ster-eo: How Different Really Are They?, International Conference onPattern Recognition, Brisbane, Australia 1998.

[4] Thierry Oggier, Michael Lehmann, Rolf Kaufmann, Matthias Sch-weizer, Michael Richter, Peter Metzler, Graham Lang, Felix Lus-tenberger, Nicolas Blanc, An all-solid-state optical range camera

for 3D real-time imaging with sub-centimeter depth resolution,Zurich 2006.

[5] http://www.ptgrey.com/ [6] http://www.mesa-imaging.ch/ [7] http://www.3dvsystems.com/ [8] Yoshimura S., Sugiyama T., Yonemoto K., Ueda K.: A 48kframe/s

CMOS Image Sensor for Real-Time 3-D Sensing and Motion Es-timation. Proc. ISSCC, February 2001.

[9] Roger Meier, Terrence Fong, Charles Thorpe, Charles Baur: A Sensor fusion based User Interface for Vehicle Teleoperation.International Conference on Field and Service Robotics (FSR

‘99), August, 1999.[10] Jiejie Zhu, Liang Wang, Ruigang Yang, James Davis: Fusion ofTime-of-Flight Depth and Stereo For High Accuracy Depth Maps,Center for Visualization and Virtual Environments, University ofKentucky, USA 2004.

[11] http://www.naviton.pl/[12] Bara ński P., Mora ński M., Strzelecki M.: System bezprzewodowej

lokalizacji obiektów. Krajowa Konferencja Elektroniki, Dar łówko2008.

[13] Bujacz M., Bara ński P., Mora ński M., Strumi łło P., Materka A.: Re-mote mobility and navigation aid for the visually disabled. The Sev-enth International Conference on Disability, Virtual Reality and As-sociated Technologies with ArtAbilitation, Porto September 2008.

Arytmetyka kwaternionów, czterowymiarowych liczb hiperze-spolonych, znalaz ła ostatnio szereg zastosowa ń w cyfrowymprzetwarzaniu sygna łów [1–10]. W szczególno ści stanowi onapodstaw ę nowych transformacji, w których elementarn ą ope-racj ą jest iloczyn kwaternionów, z których jeden jest ustalonymwspó łczynnikiem o warto ści bezwzgl ędnej równej jedno ści. Po-niewa ż implementacja fundamentalnego dzia łania wp ływa nadok ładno ść wyników i wydajno ść schematów obliczeniowych,które si ę na nim opieraj ą , celowe jest poszukiwanie nowychulepszonych algorytmów mno żenia zmiennej hiperzespolonejprzez zadany kwaternion jednostkowy.

W pracy [11] mo żna znale źć przegl ą d znanych algorytmówdo obliczania iloczynu kwaternionów, przy czym du żą uwag ę zwrócono tam na rozwi ą zania ukierunkowane na implemen-tacj ę sprz ętow ą z u życiem arytmetyki sta łoprzecinkowej. Au-torzy przedstawili te ż now ą struktur ę drabinkow ą , która jestbardziej ekonomiczna ni ż schematy obliczeniowe wynikaj ą cez konwencjonalnych faktoryzacji lifting. Chocia ż wła ściwo ściimplementacyjne uk ładu zosta ły potem przebadane ekspery-mentalnie w kontek ście banku ltrów [12], to analiz ę i redukcj ę zakresu dynamicznego rozpatrzono jedynie powierzchownie.

W niniejszym artykule przedstawiono przekszta łceniastrukturalne, które u łatwiaj ą implementacj ę drabinkowejstruktury uk ładu mno żenia kwaternionów z u życiem arytme-tyki o sko ńczonej precyzji. Proponowane podej ście polegana zast ą pieniu oryginalnego uk ładu takim, w którym mno żnik

ma tak poprzestawiane cz ęści, że odpowiedni schemat liftingcharakteryzuje si ę zminimalizowanym zakresem dynamicz-nym, co upraszcza skalowanie. Rozpatrzono najwa żniejszepowi ą zane zagadnienia: okre ślenie zbioru kwaternionów, dla

których wspó łczynniki struktury drabinkowej uk ładu mno żeniaprzyjmuj ą warto ści z po żą danego zakresu –1, 1 , zidenty ko-wanie mody kacji wspó łczynnika hiperzespolonego, które niepoprawiaj ą zakresu dynamicznego oraz konstrukcj ę stopni,którymi nale ży rozszerzy ć zmody kowany uk ład mno żenia,żeby uzyska ć odpowiednik orygina łu.

Notacja:Wektory kolumnowe i macierze wyró żniono czcionk ą pogru-bion ą , odpowiednio ma łymi i wielkimi literami. Symbole Im i J m oznaczaj ą odpowiednio macierz jednostkow ą o wymiarze m × m i macierz powsta łą z odwrócenia kolejno ści jej kolumn (lub wier-szy). Indeks górny T wskazuje macierz transponowan ą .

Mno żenie kwaternionów

Prostok ą tna reprezentacja kwaternionów obejmuje cz ęść rze-czywist ą i trzy cz ęści urojone:

(1)

przy czym jednostki urojone s ą powi ą zane nast ępują cymi za-leżno ściami:

(2)

Równania te de niują mno żenie kwaternionów, które nie jestprzemienne, chyba że jeden z operandów jest liczb ą rzeczy-wist ą lub obydwa s ą zespolone.

Rqqqqk q jqiqqq +++= 43214321 ,,,, ,

2 2 2 1

.

i j k ijk -

ij -ji k, jk -kj i, k i -ik j

= = = == = = = = =

Drabinkowa struktura uk ładu mno żenia kwaternionów:analiza i redukcja zakresu dynamicznego

dr in ż. MAREK PARFIENIUK, prof. dr hab. in ż. ALEXANDR PETROVSKY

Politechnika Bia łostocka, Katedra Systemów Czasu Rzeczywistego

Page 64: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 64/156

Page 65: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 65/156

ELEKTRONIKA 3/2010 63

gdzie jest jego norm ą , a k ą ty stanowi ą trzy pozo-sta łe stopnie swobody. Okresowo ść funkcji trygonometrycz-nych sprawia, że nie ma sensu rozpatrywa ć ką tów spozaprzyj ętego zakresu.

Przyjmuj ą c |q| = 1 i podstawiaj ą c (8) do (7), mo żna wy-znaczy ć

(9)

gdzie d = sin φ sin ψ . Okazuje si ę, że wspó łczynniki lifting wy-

st ępują w parach o tej samej warto ści bezwzgl ędnej, czyli doopisania takiego uk ładu mno żą cego wystarcza 6 liczb rzeczy-wistych.

Macierze mno żenia kwaternionów mo żna podda ć innymfaktoryzacjom lifting [17-20]. W pracy [11] pokazano, że struk-tury uzyskiwane z wi ększo ści faktoryzacji ogólnego przezna-czenia s ą mniej efektywne i mniej regularne od rozwi ą zaniazaprezentowanego powy żej: potrzeba wi ęcej operacji, a war-tości wspó łczynników lifting s ą okre ślone zagmatwanymi wy-ra żeniami, mi ędzy którymi nie ma prostych zale żno ści.

Wyra żenia (9) obowi ą zuj ą dla d ≠ 0, czyli dla φ ≠ 0 i ψ ≠ 0.Pierwszy z dwóch ostatnich warunków oznacza, że schema-tu nie mo żna wykorzysta ć w przypadku, gdy kwaternion jestliczb ą rzeczywist ą . Nie ma to znaczenia, poniewa ż jeste śmyzainteresowani tylko mno żeniami przez kwaterniony jednost-kowe, dla których |q| = 1. S ą tylko dwie takie liczby rzeczywi-ste, mianowicie q = ±1, dla których uk ład mno żą cy trywializujesię do odpowiednio kopiowania i zmiany znaku warto ści wej-ściowych. Drugi warunek uniemo żliwia u życie schematu douk ładów, w których wspó łczynnik jest liczb ą zespolon ą , alew takim przypadku mno żenie hiperzespolone jest równowa ż-ne dwóm mno żeniom zespolonym o jednostkowych mno żni-kach, z których ka żde mo że zosta ć zrealizowane z u życiemkonwencjonalnego schematu lifting opisanego faktoryzacj ą (6). Alternatywne rozwi ą zanie polega na przekszta łceniuuk ładu mno żą cego w oparciu o wyniki przestawiono dalej.

24

23

22

21 qqqqq +++=

,π φ π − ≤ < / 2 / 2,π ψ π − ≤ ≤ / 2 / 2π χ π − ≤ ≤

11 22

cos cos cos sin cos sin( ) ( ) ,a q a q d

χ φ χ φ ψ χ+ −= − =

m

12 21

sin cos sin sin cos cos( ) ( ) ,a q a q

d χ φ χ φ ψ χ+ += =m

11 22( ) ( ) cos ,b q b q d χ = − = ±12 21( ) ( ) sin ,b q b q d χ= = ±

11 22

cos cos cos sin cos sin( ) ( ) ,c q c q

d χ φ χ φ ψ χ+ += − =m

12 21

sin cos sin sin cos cos( ) ( ) ,c q c q

d χ φ χ φ ψ χ+ −= =m

Analiza zakresu dynamicznego schematówpodstawowych

Je żeli algorytm obliczeniowy ma zosta ć zaimplementowanyz u życiem arytmetyki sta łoprzecinkowej, to jest po żą dane bywszystkie wyst ępują ce w nim mno żenia rzeczywiste mia łyoperandy o warto ściach bezwzgl ędnych nie wi ększych od 1.Zapewnia to spójno ść skalowania i u łatwia jego projektowa-nie, bo mo żna wtedy za łożyć, że tylko dodawania zwi ększaj ą

zakres dynamiczny sygna łu i to najwy żej dwukrotnie, co odpo-wiada 1 bitowi ró żnicy mi ędzy d ługo ściami s łowa na wej ściui wyjściu sumatora [15].

Okazuje si ę, że żadna z faktoryzacji podstawowych nieopisuje schematu o takiej w ła ściwo ści dla ka żdej warto ściwspó łczynnika hiperzespolonego. Nawet ich wymienne u ży-cie nie jest wystarczaj ą ce, co mo żna wykaza ć do świadczalniew nast ępuj ą cy sposób.

Je żeli ka żdy k ą t z reprezentacji biegunowej (8) kwaternio-nu zostanie skojarzony z jednym wymiarem przestrzeni trój-wymiarowej, to ograniczenia na warto ści ką tów wyznaczaj ą prostopad łościan, który reprezentuje zbiór wszystkich kwater-nionów jednostkowych. Okresowo ść funkcji trygonometrycz-

nych sprawia, że ka żdy punkt na zewn ą trz bry ły ma swój od-powiednik w jej wn ętrzu.Zdyskretyzujmy prostopad łościan z tak ą sam ą rozdziel-

czo ścią wzd łuż ka żdej osi uk ładu wspó łrzędnych. Wspó łrzęd-ne przestrzenne uzyskanych w ten sposób próbek reprezen-tują trójki k ą tów, a tym samym kwaterniony, dla których mo żnaobliczy ć warto ści wspó łczynników lifting wed ług tego warian-tu (9), który jest odpowiedni do wybranej faktoryzacji lifting.Je żeli którykolwiek z otrzymanych wspó łczynników lifting mawarto ść bezwzgl ędn ą większ ą od 1, to przyjmijmy, że próbkama warto ść 1, a w przeciwnym przypadku ---0.

Utożsamiaj ą c warto ść próbki z przezroczysto ścią woksela,mo żemy wykorzysta ć gra kę wolumetryczn ą do wizualizowa-nia zbiorów danych otrzymywanych z takiego próbkowania.Przyk łady wykresów, które mo żna uzyska ć w ten sposób, s ą pokazane na rys. 2 i 3. Zosta ły one wygenerowane przy za-łożeniu, że zerowa warto ść próbki oznacza, że odpowiedniwoksel jest zupe łnie niewidoczny, a próbka równa jedno ścioznacza, że przezroczysto ść woksela jest ograniczona dopewnej ustalonej warto ści. U życie 65 × 65 ×129 = 545025 pró-bek da ło satysfakcjonuj ą cy kompromis pomi ędzy jako ścią obrazu a liczb ą oblicze ń potrzebnych do przygotowania i zwi-zualizowania zbioru danych.

Rysunki 2a i b obrazuj ą zbiory kwaternionów, dla któ-rych odpowiednio pierwsza i druga faktoryzacja podstawo-wa daje takie warto ści wspó łczynników lifting, które s ą ko-

Rys. 2. Wykresy wolumetryczne reprezentuj ą ce w dziedzinie k ą tów biegunowych zbiory kwaternionów jednostkowych, dla których(a) pierwsza, (b) druga i (c) obydwie faktoryzacje podstawowe daj ą wspó łczynniki lifting w zakresie –1,1Fig. 2. Volume plots that represent in the polar angle domain sets of quaternions for which (a) the rst, (b) second, and (c) both es-sential factorizations give lifting coef cient values in the range –1,1

Page 66: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 66/156

ELEKTRONIKA 3/201064

Rys. 3. Wykresy wolumetryczne reprezentuj ą ce w dziedzinie k ą tów biegunowych zbiory kwaternionów jednostkowych, dla którychdruga faktoryzacja podstawowa zastosowana do zmody kowanej wersji daje warto ści wspó łczynników lifting w zakresie –1,1Fig. 3. Volume plots that represent in the polar angle domain the sets of quaternions for which the second essential factorizationapplied to a permuted version gives lifting coef cient values in the range –1,1

rzystne z punktu widzenia skalowania. Jest jasne, że cho ć faktoryzacje daj ą ró żne zbiory bezwzgl ędnych warto ściwspó łczynników dla tego samego kwaternionu, to nie wy-starczaj ą one do otrzymania po żą danych amplitud w ka ż-dym przypadku.

Rezultaty otrzymane w ten sposób s ą intuicyjnie wiary-godne, cho ć nie maj ą ścis łej analitycznej podstawy. Dwafakty sugeruj ą , że poszukiwanie tej ostatniej, tzn. formalnychopisów zbiorów, jest bezcelowe. Po pierwsze, wydaje si ę,

że bry ł o tak skomplikowanych kszta łtach nie mo żna opisa ć zwięzłymi, przejrzystymi nierówno ściami, w odró żnieniu odzakresu k ą ta w przypadku zespolonym [15]. Po drugie, rys. 2(c) pokazuje, że zbiory kwaternionów skojarzone z ró żnymifaktoryzacjami przecinaj ą si ę, inaczej ni ż w schemacie liftinguk ładu mno żenia liczb zespolonych, co utrudnia ich analitycz-ne sumowanie.

Zagadnieniem wa żniejszym od analitycznego badaniazakresu dynamicznego jest wyprowadzenie dodatkowych,pochodnych schematów obliczeniowych, które umo żliwią dladowolnego kwaternionu skonstruowanie uk ładu mno żą cegoo zakresie zminimalizowanym.

Minimalizacja zakresu dynamicznegoNiekonstruktywne przekszta ł cenia mno ż nika

Łatwo zauwa żyć, że druga faktoryzacja podstawowa jestrównowa żna pierwszej zastosowanej do macierzy mno-żenia kwaternionu zmody kowanego w ten sposób, żewszystkie jego cz ęś ci zmieniaj ą znaki. Dlatego mo żna si ę spodziewa ć, że inne, równie proste zmiany struktury hi-perzespolonego mno żnika zaowocuj ą nowymi schematamilifting.

Page 67: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 67/156

ELEKTRONIKA 3/2010 65

Niestety stwierdzono, że pozosta łe mo żliwe zmiany zna-ków wp ływaj ą tylko na znaki warto ści wspó łczynników liftingi na sposób przypisania warto ści do wspó łczynników. Zbiórwarto ści bezwzgl ędnych wspó łczynników, który okre śla za-kres dynamiczny schematu obliczeniowego, pozostaje tensam.

W szczególno ści dotyczy to zast ą pienia kwaternionu licz-bą sprz ężon ą . Podobnie faktoryzacja lifting macierzy mno-żenia prawego operandu, M – (q) w (4), daje schemat o takim

samym zakresie dynamicznym, jak struktura wyprowadzonana podstawie M+ (q).

U ż yteczno ść przestawie ń cz ęś ci kwaternionu

Tym, czego poszukujemy, s ą permutacje cz ęści hiperzespolo-nego mno żnika. Poza jednym wyj ą tkiem stosuj ą c faktoryzacjepodstawowe do macierzy mno że ń zmody kowanego kwater-nionu q uzyskuje si ę ró żne zbiory warto ści bezwzgl ędnychwspó łczynników lifting dla ka żdej kon guracji faktoryzacja-permutacja.

Wyją tkiem, o którym mowa jest zamiana miejscami dwóchostatnich cz ęści urojonych, która powoduje jedynie zmian ę przyporz ą dkowania i znaku warto ści wspó łczynników lifting.

Można dowie ść , że dla q˜ = q 1 + q 2 i + q 4 j + q 3k

(10)

gdzie 2 = diag(1,–1). Wystarczy zauwa żyć, że

(11)

a

(12)

przy czym drugie równanie wynika z porównania wyra że ń nawspó łczynniki lifting dla M+ (q) i M – (q) , które wyprowadzonow [11].

Dlatego tylko po łowa z 4! = 24 mo żliwych permutacji cz ę-ści hiperzespolonego wspó łczynnika jest u żyteczna z nasze-go punktu widzenia, w łą czaj ą c uporz ą dkowanie pocz ą tkowe.Tabela 1 pokazuje na przyk ładzie, że w po łą czeniu z fakto-ryzacjami podstawowymi faktycznie pozwalaj ą one uzyska ć różne zbiory warto ści bezwzgl ędnych wspó łczynników lif-ting.

Bardziej ogólne wnioski mo żna wyci ą gn ąć analizuj ą c zbioryzilustrowane na rys. 3 wykresami wolumetrycznymi, które uzy-skano stosuj ą c metodologi ę opisan ą w punkcie 4 do drugiejfaktoryzacji po łą czonej z ka żdą z 12 u żytecznych permutacji.Wykresy dla pierwszej faktoryzacji zosta ły pomini ęte, ponie-wa ż s ą one blisko zwi ą zane w przedstawionymi. Mianowicie,wiadomo, że sinus i kosinus k ą ta φ′ = π + φ ró żnią si ę jedynieznakiem od tych samych funkcji k ą ta φ . Wobec tego przej ściedo jednej do drugiej faktoryzacji wymaga przesuni ęcia wykresuo π wzd łuż osi φ z „zawini ęciem” skali na granicy prostopad ło-ścianu, co mo żna sprawdzi ć porównuj ą c rys. 2a i b. Obserwa-cja ta jest dowodem ścis łego zwi ą zku mi ędzy faktoryzacjamipodstawowymi i sugeruje, że obydwie one powinny by ć rozpa-trywane w kontek ście zmody kowanego kwaternionu.

Patrz ą c na wykresy nie mo żna stwierdzi ć, czy pomi ędzy2×12=24 konstruktywnymi kombinacjami faktoryzacja-per-mutacja mo żna zawsze znale źć tak ą , która dla zadanegokwaternionu daje warto ści wspó łczynników lifting w po żą da-

2 2 2 2 2 2 2

2 2 2 2 2

( ) ( ),

( )q q

qq

I C J I 0 I A J

0 I J B I 0M

I

2 2 2 2,diag diag ,,q qM MI J I J

2 2 2 2 2

2 2 2 2

( ) ( ),

( )q

q

I C I 0 I A

0 I B I IM

0

q q

nym zakresie. Z innego punktu widzenia chodzi o ustalenieile kombinacji trzeba mie ć do dyspozycji, by móc ograniczy ć zakres dynamiczny uk ładu mno żą cego z dowolnym mno żni-kiem? Dlatego przeprowadzono eksperyment numeryczny,który polega ł na obliczeniu i analizie wszystkich mo żliwychsum zbiorów. Cho ć wydaje si ę to kosztowne obliczeniowo,do uzyskania wyniku potrzeba zaledwie kilku minut pracykomputera PC z procesorem AMD Athlon 64 3000+.

Okazuje si ę, że suma wszystkich zbiorów pokrywa ca ły

prostopad łościan, czyli zbiór wszystkich kwaternionów jed-nostkowych, ale to samo mo żna te ż uzyska ć stosuj ą c fakto-ryzacje podstawowe w po łą czeniu z tylko czterema dowolniewybranymi permutacjami. Z punktu widzenia implementacjista łoprzecinkowej lepiej jest zbada ć wszystkie kon guracje,poniewa ż jedna z nich mo że si ę charakteryzowa ć mniejszymwp ływem kwantyzacji wspó łczynników lifting na dok ładno ść wyniku.

Tab. 1. Warto ści wspó łczynników lifting otrzymane z faktoryzacji ma-cierzy mno że ń permutowanych wersjiTabl. 1. Lifting coef cient values obtained by factorizing multiplicationmatrices of permuted versions of

(a) pierwsza faktoryzacja podstawowa

q a 11(–a 22 )

a 12(a 21 )

b 11(–b 22 )

b 12(b 21 )

c 11(–c 22 )

c 12(c 21 )

q2+q1i +q 3 j +q 4k -0.191 -2.095 0.365 -0.183 -1.791 1.105

q3+q2i +q 1 j +q 4k -0.642 -0.910 0.730 -0.183 -0.995 0.501

q4+q2i +q 3 j +q 1k 0.152 -1.195 0.365 -0.730 -1.048 -0.595

q1+q3i +q 2 j +q 4k -0.243 -0.748 0.548 -0.183 -0.643 0.452

q1+q4i +q 3 j +q 2k 0.004 -0.495 0.365 -0.548 -0.458 -0.187

q4+q3i +q 1 j +q 2k -0.476 -0.857 0.730 -0.548 -0.956 -0.217

q1+q2i +q 3 j +q 4k -1.191 0.905 0.365 0.183 0.009 -1.495q2+q3i +q 1 j +q 4k -0.701 0.325 0.730 0.183 -0.465 -0.616

q2+q4i +q 3 j +q 1k -0.448 -0.395 0.365 0.730 -0.048 -0.595

q3+q1i +q 2 j +q 4k -1.443 0.852 0.548 0.183 -0.643 -1.548

q4+q1i +q 3 j +q 2k -1.612 -0.418 0.365 0.548 0.234 -1.649

q3+q4i +q 1 j +q 2k -0.676 -0.257 0.730 0.548 -0.436 -0.577

(b) druga faktoryzacja podstawowa

q a 11(–a 22 )

a 12(a 21 )

b 11(–b 22 )

b12(b21 )

c 11(–c 22 )

c 12(c 21 )

q2+q1i +q 3 j +q 4k 4.191 0.095 -0.365 0.183 2.591 3.295q3+q2i +q 1 j +q 4k 1.936 -0.266 -0.730 0.183 1.583 1.146

q4+q2i +q 3 j +q 1k 1.248 0.995 -0.365 0.730 0.048 1.595

q1+q3i +q 2 j +q 4k 3.043 0.348 -0.548 0.183 2.643 1.548

q1+q4i +q 3 j +q 2k 1.689 2.033 -0.365 0.548 1.227 2.341

q4+q3i +q 1 j +q 2k 1.276 0.457 -0.730 0.548 0.796 1.097

q1+q2i +q 3 j +q 4k 3.191 3.095 -0.365 -0.183 4.391 0.695

q2+q3i +q 1 j +q 4k 1.877 0.969 -0.730 -0.183 2.112 0.028

q2+q4i +q 3 j +q 1k 0.648 1.795 -0.365 -0.730 1.048 1.595

q3+q1i +q 2 j +q 4k 1.843 1.948 -0.548 -0.183 2.643 -0.452q4+q1i +q 3 j +q 2k 0.073 2.110 -0.365 -0.548 1.920 0.879

q3+q4i +q 1 j +q 2k 1.076 1.057 -0.730 -0.548 1.316 0.737

130

(4 3 2 1 )q i j k = + + +

130

(4 3 2 1 )q i j k = + + +

Page 68: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 68/156

ELEKTRONIKA 3/201066

Zast ą pienie oryginalnego uk ł adu mno żącego zmo- dy kowanym

Pozostaje pytanie, jak zast ą pić oryginalny uk ład mno żą cywersj ą o wspó łczynniku z przestawionymi cz ęściami. Mo żnasprawdzi ć, że:

(13)

gdzie P jest macierz ą permutacji, która wi ąże q z q = Pq ,a macierze P Pre i P Post reprezentuj ą proste stopnie, które nale-ży umie ścić odpowiednio przed i po zmody kowanym uk ładziemno żą cym. Stopnie obejmuj ą operacje, które s ą nieznacz ą cez punktu widzenia liczby oblicze ń, mianowicie: przekierowa-nie przep ływu danych i ewentualnie zmian ę znaku warto ścina przeciwny.

Para macierzy nie jest jednoznacznie okre ślona, ale jed-ną z takich par mo żna łatwo wyznaczy ć porównuj ą c elementymacierzy. Mianowicie, P Post opisuje takie przestawienie i/lubnegacj ę wierszy M± (q ), które daje macierz o takiej samejpierwszej kolumnie, jak w M+ (q ). Z kolei P Pre opisuje takie

przestawienie i/lub negacj ę trzech ostatnich kolumn tej ma-cierzy, że pierwszy wiersz macierzy wynikowej jest taki sam jak w M+ (q ).

Wnioski

Przedstawiony algorytm i jego mody kacje pozwalaj ą obli-czy ć wynik mno żenia zmiennej hiperzespolonej przez usta-lony kwaternion jednostkowy z u życiem 12 mno że ń i 12dodawa ń rzeczywistych, co oznacza zmniejszenie liczby ope-racji o 4 w porównaniu z bezpo średnim mno żeniem macierzyprzez wektor. Odpowiedni schemat lifting liczy mniej ga łęzii jest regularniejszy od struktur drabinkowych opisanych in-

nymi faktoryzacjami, co u łatwia optymalizacj ę wspó łczyn-ników. W szczególno ści algorytm łatwo zmody kowa ć tak,by zakres dynamiczny zosta ł zminimalizowany, co oznaczaoszcz ędno ść zasobów w wypadku implementacji sprz ętowejz u życiem arytmetyki o sko ńczonej precyzji. Przedstawionerezultaty powinny by ć u żyteczne dla osób zainteresowanychimplementacj ą kwaternionowych transformat falkowych.

Praca naukowa nansowana ze ś rodków na nauk ę w latach2009–2011 jako projekt badawczy N N516 388836.

Literatura [1] Bülow T., Sommer G.: Hypercomplex signals – a novel exten-

sion of the analytic signal to the multidimensional case. IEEETrans. Signal Process., vol. 49, no. 11, pp. 2844–2852, Novem-ber 2001.

( ) ( )( )

Post Pre

Post Pre

, if det 1,

, if det 1,

qq

q

++

− == = −

P M P PM

P M P P

%

%

[2] Pei S. C., Ding J. J., Chang J. H.: Ef cient implementation ofquaternion Fourier transform, convolution, and correlation by 2-Dcomplex FFT. IEEE Trans. Signal Process., vol. 49, no. 11, pp.2783–2797, November 2001.

[3] Bayro-Corrochano E.: The theory and use of the quaternionwavelet transform. Journal of Mathematical Imaging and Vision,vol. 24, pp. 19–35, 2006.

[4] Piotrowski A., Par eniuk M.: Cyfrowe banki ltrów: analiza, syn-teza i implementacja dla systemów multimedialnych. Wydawnict-wo Politechniki Bia łostockiej, Bia łystok, 2006, p. 389.

[5] Zhou J., Xu Y., Yang X.: Quaternion wavelet phase based stereo

matching for uncalibrated images. Pattern Recognition Letters,vol. 28, pp. 1509–1522, 2007. [6] Metikas G., Olhede S.: Multiple multidimensional Morse wave-

lets. IEEE Trans. Signal Process., vol. 55, no. 3, pp. 921–936,March 2007.

[7] Par eniuk M., Petrovsky A.: Quaternionic lattice structures forfour-channel paraunitary lter banks. EURASIP J. Adv. SignalProcess., Special Issue on Multirate Systems and Applications,vol. 2007, p. 12, 2007, Article ID 37481.

[8] Chan W., Choi H., Baraniuk R.: Coherent multiscale image pro-cessing using dual-tree quaternion wavelets. IEEE Trans. ImageProcess., vol. 17, no. 7, pp. 1069–1082, July 2008.

[9] Tsui T., Zhang X.-P., Androutsos D.: Color image watermarkingusing multidimensional Fourier transforms. IEEE Trans. Inf. Fo-rensics Security, vol. 3, no. 1, pp. 16–28, March 2008

[10] Seberry J. i in.: The theory of quaternion orthogonal designs.

IEEE Trans. Signal Process., vol. 56, no. 1, pp. 256–265, Jan.2007.[11] Par eniuk M., Petrovsky A.: Implementation perspectives of

quaternionic component for paraunitary lter banks. in Proc. Int.TICSP Workshop on Spectral Methods and Multirate Signal Pro-cessing (SMMSP), Vienna, Austria, 11–12 September 2004, pp.151–158.

[12] Par eniuk M., Petrovsky A.: Four-band paraunitary lter bankwith integer-to-integer quaternionic multiplier. in Proc. Int. Conf.on” Computer as a Tool” EUROCON 2005, vol. 1, Belgrade, Ser-bia and Montenegro, 21–24 November 2005, pp. 96–99.

[13] Howell T. D., Lafon J. C.: The complexity of the quaternion prod-uct. Cornell University, Tech. Rep. TR 75-245, Jun. 1975. [On-line]. Available: http://citeseer.ist.psu.edu/howell75complexity.html.

[14] Daubechies I., Sweldens W.: Factoring wavelet transforms into

lifting steps. J. Fourier Anal. Appl., vol. 4, no. 3, pp. 245–267,1998.[15] Oraintara S., Chen Y. J., Nguyen T. Q.: Integer Fast Fourier

Transform. IEEE Trans. Signal Process., vol. 50, no. 3, pp. 607–618, March 2002.

[16] Calderbank A. R. i in.: Wavelet transforms that map integers tointegers. Appl. Comput. Harmon. Anal., vol. 5, no. 3, pp. 332–369, July 1998.

[17] Strang G.: Every matrix is a LULU. Linear Algebra Appl., vol. 256,pp. 165–172, November 1996.

[18] Toffoli T.: Almost every unit matrix is a ULU. Linear Algebra Appl.,vol. 259, pp. 31–38, July 1997.

[19] Wang J., Sun J., Yu S.: 1-D and 2-D transforms from integersto integers. in Proc. IEEE Int. Conf. Acoust., Speech, SignalProcessing (ICASSP), vol. II, Hong Kong, 6–10 April 2003, pp.549–552.

[20] Li J.: Low noise reversible MDCT (RMDCT) and its applicationin progressive-to-lossless embedded audio coding. IEEE Trans.Signal Process., vol. 53, no. 5, pp. 1870–1880, May 2005.

Przypominamy o prenumeracie miesi ęcznika Elektronika na 2010 r.

Page 69: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 69/156

ELEKTRONIKA 3/2010 67

Operational ampli ers (OAs) belong to the most importantbuilding blocks of switched-capacitor (SC) signal processingsystems e.g. analog nite impulse response (FIR) lters [1–4].These elements have a direct in uence on the crucial para-meters of such lters i.e. power dissipation, sampling frequen-

cy, stop-band rejection, signal quality, as well as the chip areaand the fabrication costs.SC FIR analog lters can be used in those applications

that do not require a very high dynamic range, in which thestop-band rejection at the level of 30…60 dB is acceptable. Incomparison to FIR lters implemented using other techniqu-es (usually the digital ones), the SC analog lters offer a lowchip area and relatively low power dissipation at relatively highdata rate up to even several hundreds MHz.

Sampling rates ( f S) that can be achieved in such lters ma-inly depend on the parameters of the OAs used in the delayline and in the summing circuit, as well as on the ratio betweenthe largest and the smallest capacitor used in the lter coef-cients. The parameters of the OA strongly depend on theprocess, in which the lter has been realized. For example,an illustrative SC FIR GSM baseband lter designed in theCMOS 0.8 μm technology was sampled with a 2.5 MHz clockfor the voltage supply of 5 V [2]. Since one of the most impor-tant parameters was in that project a relatively high stop-bandattenuation (>60 dB), the ratio between the lter coef cientswas large, with the largest capacitance used in the feedbackof the OA equal to 54 pF. In such lters the largest capacitor isthe main limitation of the achievable sampling rate.

Another SC FIR lter realized in the CMOS 0.35 μm tech-nology has been used in the direct digital frequency synthe-sis (DDFS) system [3]. This lter sampled with a 100 MHzclock achieved signi cantly smaller stop-band rejection of30…40 dB, dissipating the power of 167 mW. This relativelylarge sampling rate was in this case possible to attain, as thevalues of all capacitors in the lter were much smaller (<1 pF)than in the lter described in [2]. Moreover, this lter has beenrealized in newer technology. Its structure (16-taps, 4 sec-tions, 4 taps each) is based on the parallel architecture thatrequires one OA per each section only [1].

Another SC FIR lter also implemented in the CMOS0.35 μm technology has been designed for the application inthe Wideband Code Division Multiple Access (WCDMA) sy-stems. This 4-tap lter with a very simple transfer function andthe only positive coef cients h i = {1, 2, 2, 1} dissipates thepower of 10 mW, while being sampled with a 10 MHz clock.

One of the possible ways to increase the sampling rate ofthe lter is using newer technologies, which allow for impro-ving the OA performance. The other way relies on decreasingthe value of the smallest capacitor, the so called unit capacitor

(UC), used in the circuit. By doing so, we increase the ratiobetween the coef cients of the lter, thus improving the lterselectivity, while keeping values of the capacitors small. A si-milar technique is recently more and more frequently used inthe low power charge redistribution successive approximation

(SAR) analog-to-digital converters (ADC) [5].

Operational ampli er for switched capacitor systems realized in various CMOS technologies

(Wzmacniacz operacyjny przeznaczony do systemów z prze łą czanymikondensatorami wykonanych w ró żnych technologiach CMOS)

dr in ż. RAFA Ł DŁUGOSZ1,2

, dr in ż. PAWE Ł PAW ŁOWSKI2

,prof. dr hab. in ż. ADAM D Ą BROWSKI 2

1 Swiss Federal Institute of Technology in Lausanne (EPFL), Institute of Microtechnology, Neuchâtel, Switzerland2 Politechnika Pozna ńska, Katedra Sterowania i In żynierii Systemów,

Pracownia Przetwarzania Sygna łów i Uk ładów Elektronicznych

Fig. 1. Two-stage OA commonly used in SC FIR lters: (a) typicalstructure, (b) improved structure [7]Rys. 1. Klasyczna (a) oraz usprawniona (b) wersja dwustopnio-wego wzmacniacza operacyjnego stosowana w ltrach SC

a)

OUT

V DD

V B V B

V ctr

IN-IN+

b)

MP3

V DD

V B

V ctr

IN-IN+OUTMN1 MN2

MN3 MN4

MP1 MP2

MP4

This paper presents a comparative study of the main pa-rameters of the OA and illustrates the in uence of the techno-logy used on the parameters of the OA. Since selective ltersare in our scope of interest, with usually large number of taps,the structure of a single OA must be as simple as possibleto achieve a small chip area as well as low power dissipa-tion of the entire lter. Considering different con icting criteria,

a typical two-stage operational ampli er (OA) [6], shown inFig . 1a has been selected as the starting point for further mo-dications and improvements. This OA after the modi cationsshown in Fig. 1b has been applied in the GSM baseband lter

Page 70: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 70/156

ELEKTRONIKA 3/201068

described in [2] and in other projects realized by the authors.Even though this OA is very simple, it features suf cientlygood parameters for many practical applications (includingthe assumed ones). The comprehensive study presented inthis paper involves several CMOS technologies i.e. the AMS(Austria Microsystems) 0.8 μm and 0.35 μm, as well as theTSMC (Taiwan Semiconductor) 0.18 μm processes.

The paper is organized as follows. In the second sectionboth versions of the OA shown in Fig 1 are shortly presented.

The following section presents a comparative study of the im-proved ampli er in different CMOS technologies. Finally, theconclusions are formulated at the end of the paper.

The classic and the modi ed two-stageoperational ampli er

The operational ampli er shown in Fig. 1a is commonly usedin these applications, which do not require extremely good pa-rameters. This ampli er has been studied many times in theliterature worldwide [6], and therefore a detailed analysis ofthis OA has been omitted in this paper.

The classic two-stage OA has several important disad-

vantages, which have big impact on the performance of theSC FIR lters. One of them is high sensitivity to the bias vol-tage V B. This voltage polarizes the input differential pair andthe output transistor MN4, which operates as the dynamicload for the output transistor MP4. In uence of the voltage V B on the OA parameters depends also on the input signalfrequency.

The output stage of the classic OA operates in A-class withthe active load. In case when the OA is optimized for the lowpower consumption, the output voltage becomes asymmetri-cal, especially when the load has value, which is close to theOA output impedance. Both the gain bandwidth product (GBP)and the DC gain also strongly depend on the value of the V B voltage. More details on this topic can be found in [6].

An experience in using the classic OA in SC FIR ltersallowed the authors to improve and to optimize the structureof this ampli er, as shown in Fig 1b . The modi cations are ma-inly in the output stage. Instead of the A-class output ampli erwith the dynamic load, a complementary AB-class ampli erhas been used in this case. This allows achieving much higherfrequencies and higher output voltage swing. A signi cant im-provement of the power dissipation has been noticed as well.Detailed simulations of the modi ed OA implemented in the

AMS CMOS 0.8 μm process are presented in [7].Henceforth the modi ed OA is further investigated in three

CMOS technologies mentioned above. Particular technolo-gies offer different parameters such as the minimal transistorsize, the value of the threshold voltage, V th, as well as the su-pply voltage range. The capacitors in particular technologiesare composed of various layers e.g. of poly1-poly2 layers in

AMS and metal layers in TSMC. All this makes scaling of boththe OA structure and other lter parameters not a straightfor-ward task.

Comparative study of the OA realized indifferent CMOS technologies

In this section the results previously presented for the 0.8 μmtechnology [7] are compared with the results obtained forthe OA redesigned in the newer technologies. Since very

selective FIR lters often contain even more than hundredcoef cients, the resultant number of OAs can be large aswell, thus the structure of a single OA should be as simpleas possible.

One of the parameters that is very important in the case ofa large number of OAs is the chip area. A comparison given belowillustrates signi cant improvements achieved in this criterion:• Chip area for CMOS 0.8 μm: 8000 μm 2

• Chip area for CMOS 0.35 μm: 1500 μm 2

• Chip area for CMOS 0.18 μm: 400 μm 2

In the CMOS 0.18 μm technology the OA occupies areawhich is only 5% of the area occupied by the same ampli errealized in the 0.8 μm technology, as shown in Fig. 2 . Additio-nally, due to various layout optimization techniques, the valueof a single UC can be reduced even 50…100 times, e.g. to12 fF in the CMOS 0.25 μm technology as described in [5].

As a result, the SC FIR lters can now be signi cantly minia-turized and used as small components in larger systems. Thisis also possible by some chip area optimization techniquesproposed by the authors in [2].

Another important parameter is the value of the supplyvoltage, V DD. This parameter has signi cant in uence on theenergy wasted in the circuit due to recharging the capacitorsin the delay line, and to even much larger extent in the ltercoef cients, as capacitors used in the coef cients have muchlarger values. In particular technologies the OA properly ope-rates with the following supply voltages, see also Fig. 3 :• 2.6…5 V in the CMOS 0.8 μm process,• 1.5…3 V in the CMOS 0.35 μm process,• 0.9…1.8 V in the CMOS 0.18

μm process.

Fig. 2. Chip area comparison of the modi ed version of OA onthe basis of realized projectsRys. 2. Porównanie powierzchni w uk ładzie scalonym zmody -kowanego wzmacniacza operacyjnego (w oparciu o zrealizowa-ne projekty)

0

1

2

3

4

5

6

0 0.2 0.4 0.6 0.8 1CMOSt ech. [µm ]

VDD[V]

Vdd_minVdd_max

0.8µm

0.18µm

0.35µm

Fig. 3. Supply voltage limits of the operational ampli er for parti-cular CMOS technologiesRys. 3. Zakresy napi ęć zasilania wzmacniacza operacyjnego dlaposzczególnych technologii CMOS

Page 71: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 71/156

ELEKTRONIKA 3/2010 69

It is worth mentioning that for the lower limit of the supplyvoltage, the OA dissipates less power but on the expense

of much lower frequency. Nevertheless this shows that thisOA is a exible solution that can be used in the circuits thatwork under varying conditions e.g. as a base-band lter thatcan be switched between the GSM and the WCDMA stan-dards [8].

In SC FIR lters an additional voltage equal to V DD/2 is re-quired. This is the ‘zero’ level used as a point of reference forthe input and the output signals.

Fig. 4 presents a comparison of another important pa-rameter – the frequency response. It can be observed thatthe maximum frequency signi cantly differs between the0.18 μm technology and the other two ones, while the dif-ference between the 0.35 μm and 0.8 μm processes is rela-tively small. One of the possible explanations of this fact isthat the AMS and the TSMC technologies offer different pa-rameters. This will be investigated in the future by additionalcomparisons with other TSMC technologies i.e. the 0.35 μmand 0.13 μm.

A more detailed comparison of the parameters describedabove as well as other parameters is presented in Table 1 .The best results have been achieved for the CMOS 0.18 μmprocess. The GBP in this case equals 1.9 GHz, and the slewrate is 2000 V/ μs. The offset voltage at the ampli er input isrelatively small in this technology and equals 120 μV. Whencomparing the power dissipation for particular technologies,an interesting observation can be made. In case of the upperlimit of the supply voltage the power dissipation does not dif-fer signi cantly. In the 0.18 μm process it is only three timessmaller than in the 0.8 μm technology. On the other hand forthe lower limit it differs much more i.e. it is almost twenty timessmaller. This shows that in the TSMC 0.18 μm technology thisOA is a much more exible solution [8].

On the other hand, the OAs and the resulting SC FIR l-ters realized in newer technologies have also some disadvan-tages. The reduced supply voltage is the reason for smallerachievable dynamic range, which results from the reducedsignal-to-noise ratio (SNR), as shown in Fig. 5 . In the 0.8 μmprocess the output voltage swing V pp (peak-to-peak voltage)equals 3.4 V for the supply voltage of 5 V. In the 0.18 μm pro-cess for V DD of 1.8 V the voltage swing is reduced to 1.34 V. If

the environmental noise level is similar in both cases, the lterdynamic range and discrimination level are reduced. This isalso visible in signi cantly smaller value of the CMRR (com-mon-mode reduction ratio), as presented in Table 1 .

Tab. 1. Comparison of the main parameters of the OA realized in dif-ferent technologies

Technology/Parameter

0.8 μm 0.35 μm 0.18 μmSS model

0.18 μmTT model

0.18 μmFF model

DC gain 76 dB 72 dB 77 dB 76 dB 71 dB

Gain bandwidthproduct (GBP)

11 MHz 30 MHz 1.5 GHz 1.9 GHz 2.1 GHz

Power dissipa-tion

2.8 mW for V DD=5 V

240 μW forV DD=2.6 V

1.3 mW forV DD=3 V

40 μW for V DD=1.5 V

0.5 mW forV DD=1.8 V4 μW for

V DD=0.9 V

0.6 mW forV DD=1.8 V7 μW for

V DD=0.9 V

0.8 mW forV DD=1.8 V14 μW for V DD=0.9 V

Slew rate (SR) 12 V/ μs 80 V/ μs 1000 V/ μs 2000 V/ μs 2000 V/ μs

Input offsetvoltage

4 mV 0.5 mV 210 μV 120 μV 65 μV

CMRR 90 dB 62 dB 63 dB 62 dB 60 dB

Minimum out-putvoltage(R L=10 k Ω)

0.6 V forV DD=5 V

0.55 V for V DD=2.6 V

0.4 V forV DD=3 V

0.36 V for V DD=1.5 V

0.11 V forV DD=1.8 V0.13 V for V DD=0.9 V

0.10 V forV DD=1.8 V0.11 V for V DD=0.9 V

0.09 V forV DD=1.8 V0.09 V for V DD=0.9 V

Maximumoutput voltage(R L=10 k Ω)

4 V for V DD=5 V2.3 V for

V DD=2.6 V

2.6 V forV DD=3 V

1.35 V for V DD=1.5 V

1.47 V forV DD=1.8 V0.66 V for V DD=0.9 V

1.47 V forV DD=1.8 V0.68 V for V DD=0.9 V

1.47 V forV DD=1.8 V0.70 V for V DD=0.9 V

Fig. 4. Frequency response of the operational ampli er in differ-ent CMOS technologiesRys. 4. Charakterystyka cz ęstotliwo ściowa wzmacniacza opera-cyjnego wykonanego w ró żnych technologiach CMOS

0

10

20

30

40

50

60

70

80

1.E+00 1.E+02 1.E+04 1.E+06 1.E+08 1.E+10

AdB ] 0.8µm

0.35µm

0.18µm

1 100 1k f [Hz] 1M 100M 10G

[

Fig. 5. Output voltage swing of the OA vs. supply voltage in va-rious technologiesRys. 5. Zakres zmienno ści napi ęcia wyj ściowego wzmacniaczaoperacyjnego w funkcji napi ęcia zasilania dla ró żnych techno-logii

0

1

2

3

4

0 1 2 3 4 5V DD [V]

V out[V]

Vmin 0.8µm

Vmin 0.35µm

Vmin 0.18µmVmax 0.8µm

Vmax 0.35µmVmax 0.18µm

To make the comparison presented in this paper morecomplete the corner analysis has been additionally perfor-med for different processes, voltage, and temperature (PVT)parameters variation. The results of this analysis are presen-ted in Table 1 as well as in Fig. 6.

Comparing the results for the CMOS 0.18 μm technolo-gy one can observe that for a given supply voltage, powerdissipation decreases when moving from the FF (fast-fast)through the TT (typical-typical) to the SS (slow-slow) transi-

stor model. The reason of this is the increasing threshold vol-tage, V th, for slower models. The main power consumer in thisOA is its output stage, which in the improved version of theOA is composed of two transistors connected like in the logic

Page 72: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 72/156

ELEKTRONIKA 3/201070

inverter, with the input voltage at this element being equalto about V

DD/2. Looking from the power dissipation point of

view this is the worst case scenario, since both transistorsare opened in this case and their channels have the smal-lest resistances. For constant values of the gate-to-sourcevoltages ( V GS ) the channel resistances depend on the valuesof the V th i.e. the resistances become larger for larger valuesof V th. Unfortunately, the reduced power dissipation is on theexpense of the smaller value of the slew rate (SR). For theslower transistor models the results are closer to those thatcould be obtained using the older technologies, e.g. CMOS0.25 μm. On the other hand, the faster models provide theresults similar to those obtained in newer technologies. Ob-serving this dependence allows, to some degree, to predictthe ampli er performance for newer technologies e.g. for the0.13 μm process.

The sizes of transistors used in the OAs realized in par-ticular technologies are collected in Table 2 . Since the am-pliers have been recently redesigned and optimized by theauthors, the values given in Table 2 usually differ from theprevious versions of the OA, which were used in the projectsshown in Fig. 2 .

Fig. 6. The input offset voltage and (a) the DC gain of the OA (b)vs. temperature in 0.18 μm technologyRys. 6. Napi ęcie niezrównowa żenia (a) oraz wzmocnienie napi ę-ciowe (b) w funkcji temperatury dla technologii 0,18 μm

Conclusions A two-stage OA has been realized and compared in the CMOS0.18 μm, 0.35 μm, and 0.8 μm technologies being standardtechnologies in recent years. The presented results show thatthe OA implemented in newer technologies is much faster andoccupies much smaller chip area, but as the supply voltage issmaller, it suffers from lower dynamic range. This shows thatpotential applications of SC lters realized in various technolo-

gies will be quite different. For example, such

lters in modernapplications that typically require high values of f S and mildattenuations are fortunately suitable if not ideal for new andfuture CMOS integration technologies.

This work was supported by the project 93-72/10-BW.

References[1] Dą browski A.: Multirate and multiphase switched – capacitors

circuits. Chapman & Hall, London, 1997.[2] Dą browski A., D ługosz R., Paw łowski P.: Integrated CMOS GSM

baseband channel selecting lters realized using switched ca-pacitor nite impulse response technique. Microelectronics Reli-ability Journal, vol. 46, May-June 2006.

[3] Seng-Pan U., Martins R.P., Franca J.E.: A 2.5-V 57-MHz 15-tapSC bandpass interpolating lter with 320-MS/s output for DDFSsystem in 0.35um CMOS. IEEE J. of Solid-State Circuits, vol. 39,Issue 1, 2004, pp. 87 – 99.

[4] Repo H., Rahkonen T.: Programmable switched capacitor 4-tapFIR lter. Proceedings of the 29th European Solid-State CircuitsConference, 2003, pp. 445 – 448.

[5] Scott M.D., Boser B.E., Pister K.S.J.: An ultralow-energy ADC forSmart Dust. IEEE Journal of Solid-State Circuits, vol. 38, Issue7, July 2003, pp.1123–1129.

[6] Palmisano G., Palumbo G., Pennisi S.: Design Procedure forTwo-Stage CMOS Transconductance Operational Ampli ers:

A Tutorial. Journal Analog Integrated Circuits and Signal Pro-cessing, Springer Netherlands, vol. 27, no.3, May 2001.

[7] Dą browski A., D ługosz R., Paw łowski P.: Design and optimizationof operational ampli ers for FIR SC GSM channel lter realized

in CMOS 0.8 μm technology. IEEE Signal Processing, Pozna ń 2004, pp. 33 – 36.[8] Długosz R., Iniewski K.: Programmable Switched Capacitor Fi-

nite Impulse Response Filter with Circular Memory Implementedin CMOS 0.18 m Technology. Journal of Signal Processing Sys-tems (formerly the Journal of VLSI Signal Processing Systemsfor Signal, Image, and Video Technology), Springer New York,DOI: 10.1007/s11265-008-0233-3, June 10, 2008, printed in vol.56, no. 2-3/(September 2009), pp. 295-306.

-1

-0.5

0

0.5

1

1.5

2

-40 -20 0 20 40 60 80 100 120T [°C]

V offs [mV]

TT modelSS modelFF model

60

65

70

75

80

85

-40 -20 0 20 40 60 80 100 120T [°C]

G [dB]

TT modelSS model

FF model

Tab. 2. Transistor sizes [ μm] in the ampli er in particular technolo-gies

MN1W/L

MN2W/L

MN3W/L

MN4W/L

MP1W/L

MP2W/L

MP3W/L

MP4W/L

CMOS0.8 μm

10/3 10/3 10/3 5/1 10/3 10/3 2/0.4 15/1

CMOS0.35 μm

10/3 10/3 10/3 4/0.5 10/3 10/3 2/0.4 12/0.5

CMOS0.18 μm 14/0.5 14/0.5 14/0.5 2/0.8 14/0.5 14/0.5 1/0.2 6/0.8

Page 73: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 73/156

ELEKTRONIKA 3/2010 71

Detekcja ruchu oraz śledzenie poruszaj ą cych si ę obiek-tów w obrazie wideo jest nowym obszarem bada ń, który zewzgl ędu na narastaj ą ce problemy w lokalnym oraz global-nym bezpiecze ństwie, sta ł si ę bardzo wa żny. Wspó łczesnesystemy monitoringu CCTV (ang. Closed-Circuit Television )s ą już cz ęsto wspierane przez procedury automatyzacji orazkomputery. Coraz wi ęcej systemów korzystaj ą cych z prze-twarzania wideo dzia ła autonomicznie, np. wideo-radary(średnia pr ędko ść pojazdów jest wyznaczana na podsta-

wie danych z dwóch kamer nagrywaj ą cych ruch pojazdóww dwóch odleg łych punktach) lub urz ą dzenia analizy wideow procesach produkcyjnych. Z drugiej jednak strony, w tele-wizji przemys łowej oraz systemach monitoringu, ci ą gle za-uwa żalny jest brak automatyzacji. Stra żnicy w celu zauwa-żenia potencjalnie niebezpiecznych sytuacji musz ą zwraca ć uwag ę na wiele ekranów jednocze śnie. Po kilku godzinachtakiej monotonnej pracy, jest bardzo prawdopodobne, żestra żnik przeoczy zagro żenie lub zareaguje ze zbyt du żymopó źnieniem.

G łównym celem tego artyku łu jest analiza istniej ą cychalgorytmów detekcji obiektów, detekcji ruchu oraz śledzeniaobiektów, jak równie ż implementacja wybranych algorytmóww systemie dzia łają cym w czasie rzeczywistym. System tensk łada si ę z komputera PC wyposa żonego w kart ę telewizyjn ą oraz z kamery zamontowanej na obrotnicy i pod łą czonej dokomputera. G łównym zadaniem oprogramowania jest identy-kacja charakterystycznych w łaściwo ści śledzonego obiektu,wyznaczenie jego wektora pr ędko ści i sterowanie kamer ą tak,aby obiekt znajdowa ł si ę w centrum pola widzenia. Oprogra-mowanie dzia ła z systemem operacyjnym Linux i korzystaz darmowych bibliotek do obs ługi interfejsów m.in. karty te-lewizyjnej, a do analizy obrazu u żyto bibliotek Open CV [18,25].

Zaprojektowany system mo że zosta ć wykorzystany dowspomagania nast ępują cych zada ń:• detekcji oraz śledzenia poruszaj ą cych si ę obiektów w sy-

stemach monitoringu np. detekcji obecno ści ludzi w za-mkni ętych pomieszczeniach,

• detekcji nietypowych lub niebezpiecznych zdarze ń, np.detekcji samochodów poruszaj ą cych si ę w z łym kierunku,detekcji potencjalnie niebezpiecznych osób np. biegn ą -cych w t łumie

• detekcji t łumu• detekcji porzuconych przedmiotów; obiekty takie maj ą ze-

row ą pr ędko ść , jednak ró żnią się od typowego, znanegoi zarejestrowanego wcze śniej t ła.

Artyku ł ten posiada nast ępuj ą cą struktur ę . Po wst ępiezosta ły opisane techniki oraz algorytmy cyfrowego prze-twarzania sygna łów DSP (ang. Digital Signal Processing )

s łużą ce do detekcji ruchu oraz ś ledzenia obiektów w sygna-le wideo, dalej opisano zaprojektowany system do ś ledze-nia obiektów w czasie rzeczywistym oraz podsumowaniupracy.

System CCTV do automatycznego ś ledzenia obiektóww czasie rzeczywistym

dr in ż. PAWE Ł PAW ŁOWSKI, mgr in ż. KRZYSZTOF BOROWCZYK,dr in ż. TOMASZ MARCINIAK, prof. dr hab. in ż. ADAM D Ą BROWSKI

Politechnika Pozna ńska, Katedra Sterowania i In żynierii Systemów,

Pracownia Uk ładów Elektronicznych i Przetwarzania Sygna łów

Analiza wideo w detekcji oraz ś ledzeniuporuszaj ą cych si ę obiektów

Detekcja obiektów oraz wykrywanie ich ruchu mo że zosta ć zrealizowane zarówno oddzielnie, jak i łą cznie. Do wykrywa-nia obiektów mo żna u żyć ich statycznych oraz dynamicznychcharakterystyk. Oznacza to, że analizy mo żna dokona ć już na pojedynczej klatce wideo. Obiekt mo że by ć opisany przezkolor lub kszta łt. Maj ą c dost ępnych kilka klatek wideo jeste-

śmy w stanie wykry ć obiekt na podstawie wektorów pr ęd-kości, b ą dź ró żnic pomi ędzy aktualn ą klatk ą , a wcze śniejprzygotowanym obrazem t ła. Metody opisane dalej ró żnią się obliczenioch łonno ścią oraz wymaganiami, w zwi ą zku z czympowinny by ć dobierane do danej aplikacji, a w celu wykorzy-stania w systemie czasu rzeczywistego specjalnie optymizo-wane.

Algorytmy wykrywania obiektów

Najprostsze algorytmy wykrywania obiektów dokonuj ą takiej ltracji ramki, która pozwala na uwypuklenie po żą danych cechposzukiwanego obiektu. Spo śród stosowanych ltrów nale żywymieni ć: ltry segmentacji, detektory kraw ędzi i punktów, ltry medianowe, ltry wyg ładzaj ą ce oraz ltry zwi ększaj ą cekontrast.

Mapa kraw ędzi [27] nale ży do najprostszych metod.Dopasowuje ona wykryte kraw ędzie do zadanego kszta łtu(np. elipsy dla twarzy). Ze wzgl ędu na mo żliwość obrotuoraz zmiennego kadrowania, baza kszta łtów referencyj-nych musi zawiera ć wiele kombinacji konturów, b ą dź al-gorytm dopasowywania konturów musi by ć wystarczaj ą coelastyczny. W pierwszym przypadku liczba zebranych wa-riantów jest ograniczona, w drugim przypadku nawet du żaelastyczno ść algorytmu mo że okaza ć si ę niewystarczaj ą -ca. Taka sytuacja ma miejsce w przypadku ludzkiego cia ła.Cz łowiek stoj ą cy znacznie ró żni si ę kszta łtem od cz łowiekanp. kucaj ą cego, w zwi ą zku z czym model dopasowuj ą cyoba kszta łty jest zbyt ogólny i mo że generowa ć fa łszywewyniki.

Drugim, bardziej z łożonym rozwi ą zaniem jest wzi ęcie poduwag ę tak że koloru obiektu [27]. Znajomo ść koloru upraszczadetekcj ę kszta łtu. Mo żliwe jest tak że wyznaczenie k ą ta obrotuprzedmiotu i obrócenie go do pozycji referencyjnej (zerowej).

Analiza barwy u łatwia znalezienie punktów charakterystycz-nych.

Inne metody dodatkowo analizuj ą mask ę (lub model)otrzymany w wyniku przetwarzania wst ępnego. Metody te s ą oparte na poszukiwaniu takich parametrów jak: d ługo ść , wy-soko ść , stosunek d ługo ści do wysoko ści, odleg łość pomi ędzywybranymi punktami. Warto tutaj wymieni ć metod ę hierar-

chiczn ą , która korzysta jedynie z analizy przestrzennej z po-mini ęciem czasu [27]. Je śli uwzgl ędnimy odleg łość obiektu odkamery, mo żemy wyznaczy ć wielko ść obiektu i porówna ć goz rzeczywistym rozmiarem [17].

Page 74: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 74/156

ELEKTRONIKA 3/201072

Spo śród wielu technik wykorzystuj ą cych kszta łt obiektu,nale ży wymieni ć model ASM (ang. Active Shape Model ) [27].

Innym z algorytmów tego typu jest algorytm SAD (ang.Sum Of Absolute Difference ). Klatka wej ściowa jest tu ana-lizowana w poszukiwaniu podobie ństw do obiektu referen-cyjnego. W wyniku otrzymujemy wska źniki podobie ństwapomocne przy zlokalizowaniu obiektu najbardziej podobnegodo obiektu poszukiwanego [13]. Mo żemy tak że doda ć pro-gowanie oraz klasy kacj ę wykrytych rejonów, gdzie warto ść

progowa mo że by ć ustalana adaptacyjnie. Wymaga to jed-nak dodatkowej analizy w dziedzinie czasu. Wykorzystanietej metody do detekcji osób wymaga wielu obrazów referen-cyjnych. Analiza tak du żej ilo ści danych jest równie ż bardzoczasoch łonna.

Do bardziej z łożonych metod nale żą klasy katory Haar’a,które opieraj ą się na klasy katorach kaskadowych [23]. Ucze-nie klasy katora polega na analizowaniu du żej bazy zdj ęć za-wieraj ą cych poszukiwany obiekt. Ka żdy poziom klasy katora

jest trenowany za pomoc ą algorytmu Adaboost (ang. adaptiveboosting), a wszystkie poziomy łą cznie tworz ą z łożone drze-wo decyzyjne. Zaletami algorytmu Adaboost jest szybko ść dzia łania, skalowalno ść i mo żliwość predykcji pozycji obiektu

w nast ępnej klatce. Algorytm adaboost najcz ęściej jest wyko-rzystywany do detekcji twarzy. Algorytm ten jest zaimplemen-towany w bibliotece OpenCV [23, 26].

Zamiast wykorzystywania pe łnego zdj ęcia twarzy mo ż-liwe jest u życie modelu zredukowanego, tzw. eigenface ,który sk łada si ę z wektorów w łasnych (ang. eigenvectors ),rozpinaj ą cych w ła ściwą podprzestrze ń o ma łej liczbie wy-miarów. Rozwi ą zanie to znacz ą co upraszcza zadanie kla-sy kacji [23]. Redukcja wymiarowo ści przestrzeni mo żebyć zrealizowana za pomoc ą analizy sk ładowych g łównychPCA (ang. Principal Component Analysis ). Dodatkow ą za-let ą powy ższych redukcji jest tak że zmniejszenie wymaga ń dotycz ą cych pami ęci cech [35]. Dekompozycja w łasna (ang.eigen-decomposition ) umo żliwia, w przeciwie ństwie do po-przednich metod, opis obiektów o zmiennym kszta łcie, jaknp. biegn ą cy pies [12].

Algorytmy wykrywania ruchu

Istnieje wiele technik detekcji ruchu, praktycznie wszystkiez nich korzystaj ą z analizy s ą siednich klatek sekwencji wideo.Wiele z tych algorytmów mo że pracowa ć w czasie rzeczywi-stym.

Wyró żnia si ę kilka typów technik:• wykorzystanie równania przep ływu optycznego,• wyznaczanie podobie ństwa pomi ędzy klatkami,• techniki ró żnicowe,• techniki bazuj ą ce na śledzeniu konturów.

Wspóln ą cech ą wymienionych technik jest tworzenie bi-narnego obrazu, który zawiera segmenty reprezentuj ą ceporuszaj ą ce si ę obiekty. Niestety opisane w ten sposób seg-menty nie zawieraj ą zbyt wielu danych o obiektach do dalszejobróbki. Żadna z tych technik nie jest uniwersalna, w zwi ą zkuz czym w łaściwy algorytm powinien zosta ć dobrany do dane-go zastosowania. Najlepsze rezultaty mo żna uzyska ć przezwielokrotne przetwarzanie wej ściowej sekwencji wideo i zmie-nianie parametrów kontrolnych, jednak takie post ępowanie

jest praktycznie niemo żliwe do realizacji w systemach czasurzeczywistego.

Techniki wykorzystuj ą ce równanie przep ł ywu optycznego

Algorytmy wykorzystuj ą ce równanie przep ływu optycznegomog ą by ć u żyte do wykrycia ruchu, podzia łu obrazu na seg-menty i wyznaczenia trajektorii obiektów [22, 31]. Metody tebazuj ą na za łożeniu, że dla ka żdej klatki w sekwencji mo żliwe

jest wyznaczenie pola wektorowego. Korzystaj ą c z poprzed-niej klatki oraz pola wektorowego klatki bie żą cej mo żliwa jestpredykcja nast ępnej klatki w sekwencji wideo. Wektory polaopisuj ą pr ędko ść oraz kierunek ruchu poszczególnych regio-nów obrazu. Regiony te mog ą by ć regularne (np. makroblokiw kodowaniu MPEG), nieregularne, a nawet mog ą dotyczy ć pojedynczego punktu. Pocz ą tkowo techniki tego typu by ły wy-korzystywane do analizy obrazów w skali szaro ści. Z czasem

jednak zosta ły rozszerzone tak że na obrazy kolorowe [2], dla

których najcz ęściej s ą wykorzystywane w algorytmach kom-presji wideo.Istniej ą dwie popularne metody bazuj ą ce na równaniu

przep ływu optycznego: metoda Lucas’a i Kanade’a orazmetoda Horn’a i Schunck’a [8, 16, 21]. Pierwsza z nich jestmetod ą z grupy tzw. lokalnych, które zak ładaj ą , że wektorruchu jest sta ły dla niewielkich obszarów (bloków) obrazu.Metody lokalne s ą mniej wra żliwe na zak łócenia, ale two-rzą pole wektorowe o mniejszej g ęsto ści. Algorytm Lucas’ai Kanade’a zak łada, że dla danego obiektu wektory ruchu s ą sobie równe. Druga grupa to metody globalne, do którychnale ży algorytm Horn’a i Schunck’a. Algorytm ten pozwa-la na wyznaczenie przemieszczenia dla wszystkich pikseli

z osobna, jednak nak łada ograniczenie na wariancj ę wekto-rów ruchu. Z tego te ż powodu algorytmy te odrzucaj ą mo ż-liwość istnienia obiektów wielko ści jednego piksela. Metodyglobalne s ą ponadto bardzo wra żliwe na szum w sygnalewej ściowym [34].

Techniki oparte na podobie ństwie pomi ę dzy klatkami

Algorytmy te poszukuj ą podobie ństw pomi ędzy s ą siednimiklatkami w strumieniu wideo. Przyk ładem takiego uj ęcia jestalgorytm dopasowywania bloków. Sk łada si ę on z trzech faz:podzia łu wej ściowej klatki na bloki, poszukiwaniu pasuj ą -cych bloków przy u życiu zadanego kryterium oraz oblicze-niu binarnej maski reprezentuj ą cej przemieszczenie. Ju ż sam dobór odpowiedniej wielko ści bloków nie jest zadaniemtrywialnym. Du że bloki s ą mniej wra żliwe na szum, jednakto mniejsze bloki daj ą lepsz ą reprezentacj ę ruchu. Najlep-sze rezultaty osi ą ga si ę przy u życiu bloków o rozmiarachzbliżonych do rozmiarów poruszaj ą cych si ę obiektów [14].Innym wa żnym problemem jest wybór obszaru przeszukiwa-nia. Du ży obszar mo że da ć dok ładniejsze rezultaty jednakzłożono ść obliczeniowa ro śnie proporcjonalnie do kwadratuprzeszukiwanej powierzchni.

Główn ą zalet ą powy ższych technik jest mo żliwość śledze-nia obiektów przy relatywnie prostych obliczeniach. Najlepszerezultaty osi ą ga si ę przy u życiu kamery nieruchomej. Dodat-kowe przyspieszenie oblicze ń mo żna uzyska ć przy pomocyalgorytmu FBBMA (ang. Fast Binary Block Matching Algorit-hm ) przez wykorzystanie klatek binarnych zamiast pe łnej 8-bitowej reprezentacji obrazu [30].

Techniki ró ż nicowe

Algorytmy te obliczaj ą ró żnic ę pomi ędzy aktualn ą klatk ą a poprzednio przygotowanym t łem [1, 28], co pozwala nawykrycie wszelkich zmian w sekwencji wideo. Obliczonaróżnica reprezentuje pojawienie si ę , znikni ęcie lub porusza-nie si ę obiektów. Po wyliczeniu ró żnicy, przed nast ępnymkrokiem przetwarzania, typowo dokonuje si ę progowaniaoraz uwypuklenia po żą danych cech za pomoc ą operacjimorfologicznych. G łównymi zaletami metod tej klasy s ą :cią g łe wykrywanie poruszaj ą cych si ę obiektów, prosto-

ta realizacji oraz mo żliwość parametryzacji wyników przyużyciu ró żnych warto ści progowych. Podstawowym proble-mem jest jednak brak mo żliwości ś ledzenia poruszaj ą cegosię obiektu oraz poprawne wyznaczanie t ła. Do obliczania

Page 75: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 75/156

ELEKTRONIKA 3/2010 73

tła mo żna wykorzysta ć ruchom ą średni ą , która umo żliwiadaptacj ę tła przy powolnych jego zmianach (np. zmianyoświetlenia w ci ą gu doby). Niektóre obiekty, które pozostaj ą w bezruchu na d łuższy czas mog ą jednak zosta ć potrakto-wane jako t ło i sta ć si ę niewidocznymi dla algorytmu wykry-wania ruchu. Rozwi ą zaniem tego problemu jest dynamicznemodelowanie t ła przy u życiu statystyk oraz predykcji ru-chu [24].

Techniki bazuj ą ce na ś ledzeniu konturów

Ostatni ą wa żną grup ą metod s ą techniki wykorzystuj ą ce śle-dzenie konturów. Metody te wykorzystuj ą techniki opisanewcze śniej, jednak upraszaj ą obliczenia. Zamiast analizowa-nia pe łnych klatek dzia łają jedynie na konturach wyznaczo-nych przez ltr wyznaczaj ą cy kraw ędzie. Przyk ładem mo żebyć detektor ruchomych obiektów wykorzystuj ą cy przep ływoptyczny [33]. G łównymi zaletami technik śledzenia konturówsą : zmniejszona ilo ść danych do przetwarzania oraz niewielkawra żliwość na warunki o świetlenia.

Bardziej zaawansowane algorytmy radz ą sobie z takimiproblemami jak odpowiednie wyznaczenie ca łego obiektu,segmentacja obiektów i t ła oraz klasy kacja obiektów. Ponad-

to istniej ą jeszcze pomocnicze algorytmy, przydatne przy wy-krywaniu ruchu i śledzeniu obiektów.

Algorytmy pomocnicze Analiza plamek (ang. blob analysis)

Tak zwana analiza plamek operuje na grupach pikseli, nazy-wanych plamkami (ang. blob ) [3]. Pozwala ona wyznaczy ć po-wierzchni ę, środek, wielko ść , orientacj ę oraz lokalizacj ę danejgrupy pikseli. Algorytmy te obliczaj ą obiekty w wierszach i ko-lumnach, dzia łają c na ramkach wcze śniej przetworzonych dopostaci binarnej.

Filtry Kalmana

Dane wyj ściowe, które s ą rezultatem lokalizacji albo wy-znaczania wielko ści, np. przy u życiu analizy plamek bar-dzo cz ęsto zawieraj ą b łędy oraz szum, co mo że wp łyn ąć na b łędn ą interpretacj ę wyników. W takich i podobnychprzypadkach, w celu odseparowania szumu, wykorzystujesię ltry Kalmana [19]. Filtr Kalmana uwzgl ędnia dynamik ę danych wej ściowych. Obliczenia s ą wykonywane przy u ży-ciu aktualnych danych, danych poprzednich oraz warun-ków pocz ą tkowych. Zastosowanie ltru Kalmana pozwalana uzyskanie dok ładniejszych wyników oraz predykcj ę da-nych.

Ś ledzenie ruchomych obiektów

Opisane powy żej metody wykrywania obiektu lub ruchu s ą pierwszym etapem przy śledzeniu obiektów ruchomych. Zwy-kła detekcja obiektu i ruchu mo że nie by ć wystarczaj ą ca do

jego śledzenia w przypadku, gdy np. wykryjemy twarz w jednejklatce, wykryta twarz w nast ępnej klatce mo że, ale nie musinale żeć do tej samej osoby. Jeszcze trudniejsz ą sytuacj ą jestta, kiedy dwa podobne, poruszaj ą ce si ę obiekty mijaj ą się.

Algorytm śledzenia mo że źle sklasy kowa ć śledzony obiekti zamieni ć go z drugim.

Z tego powodu, do jednoznacznej klasy kacji obiektów s ą potrzebne dodatkowe testy. Najprostsze rozwi ą zanie zak łada,że klasy katory obiektu (np. zaznaczone jako prostok ą tnaramka wokó ł obiektu) s ą w s ą siednich klatkach na zbli żonychpozycjach, a ich przesuni ęcie jest ograniczone. Maksymalne

przesuni ęcie klasy katorów w kolejnych klatkach zale ży rów-nie ż od liczby klatek przetwarzanych w jednostce czasu (np.w jednej sekundzie). Niewielka liczba przetwarzanych klatekwprowadza dodatkowe ograniczenie na pr ędko ść śledzonych

obiektów. Przy przekroczeniu limitu pr ędko ści śledzony obiektzostanie sklasy kowany w kolejnych klatkach jako nowy, od-r ębny obiekt.

Do pod ążania za obiektem korzystamy g łównie z informa-cji o kolorze lub kszta łcie wybranego celu. Do reprezentacjikolorów mo żna wykorzysta ć sk ładowe sygna łu (czerwony,zielony i niebieski z systemu RGB lub U, V z systemu YUV),

jednak cz ęściej wykorzystuje si ę odcie ń (H) z systemu HSV/HSB ( Hue, Saturation, Value/Brightness ) lub HSL ( Hue, Sa-

turation, Lightness ). Podczas inicjalizacji takiego rodzaju al-gorytmu najpierw wybieramy odcie ń (hue ) i jego maksymaln ą wariancj ę lub wskazujemy obiekt do śledzenia. Nast ępniealgorytm wylicza wymagane parametry, przewa żnie poprzezporównywanie sk ładowych koloru lub histogramów analizo-wanego obszaru [20].

Zamiast koloru mo żemy pod ąża ć za konturem wyzna-czonego obiektu. Kontur wyznaczamy za pomoc ą ekstrak-tora kraw ędzi. W kolejnych klatkach poszukujemy takiegosamego albo kszta łtu zbli żonego do tego z poprzedzaj ą cychklatek lub porównujemy aktualny kszta łt z kszta łtem refe-rencyjnym obiektu, który, ma by ć ś ledzony [32]. G łówn ą za-let ą tego algorytmu jest odporno ść na zmiany w środowisku

a tak że na zmienne warunki o świetleniowe. Podstawowymproblemem jest skonstruowanie odpowiedniego modelu[27].

Algorytm CAMSHIFT

Algorytm CAMSHIFT (ang. Continuously Adaptive MeanShift ) zosta ł zaprojektowany do śledzenia poruszaj ą cych si ę obiektów w sekwencjach wideo. Wykorzystuje on algorytmMeanShift [11] opisany w [6, 7]. Model ten zosta ł opracowanydo śledzenia twarzy, jednak mo żna go wykorzysta ć do ś le-dzenia dowolnego obiektu o wzgl ędnie jednorodnej kolory-styce.

Algorytm CAMSHIFT wyznacza sk ładow ą barwy ( hue )poprzez konwersj ę obrazu z przestrzeni RGB do przestrze-ni HSV. W kolejnych obliczeniach jest wykorzystywanytylko komponent barwy. Takie podej ście upraszcza obli-czenia i sprawia, że algorytm jest ma ło wra żliwy na zmia-ny w o świetleniu. Algorytm rozpoczyna prac ę od danego,z góry ustalonego okna przeszukiwania. Ustala okno obli-cze ń o wspólnym środku z oknem przeszukiwania i wyzna-cza map ę prawdopodobie ństwa dla tego okna. Nast ępnie zapomoc ą algorytmu MeanShift [9] obliczane jest maksimumfunkcji g ęsto ści prawdopodobie ństwa. Punkt odpowiadaj ą -cy maksimum ustalany jest jako nowe centrum okna prze-szukiwania. Je ś li przemieszczenie okna by ło mniejsze ni ż pewna ustalona warto ść progowa algorytm ko ńczy swoj ą prac ę zwracaj ą c aktualne parametry. W przeciwnym wypad-ku, w nowo ustalonym oknie przeszukiwania, algorytm po-szukuje maksimum funkcji g ęsto ści prawdopodobie ństwa,ustalaj ą c aktualn ą pozycj ę i rozmiar okna przeszukiwania.Poniewa ż śledzony obiekt mo że porusza ć s i ę w dowolnymkierunku, na obrazie wideo mo że on nie tylko zmienia ć po-zycj ę , ale mo że tak że by ć mniejszy lub wi ększy. Dlatego te ż algorytm MeanShift wsparty jest przez dodatkow ą funkcj ę regulowania wielko ści okna przeszukiwania. Nale ży tutajzaznaczy ć, iż zbyt du że okno przeszukiwania mo że spowo-dowa ć „złą czenie” ś ledzonego obiektu z innymi obiektamio podobnej kolorystyce, natomiast zbyt ma łe okno prze-szukiwania nie pozwoli na poprawne wyznaczenie punktucentralnego. Algorytm sprawuje si ę najlepiej w przypadku,

gdy ś ledzony obiekt posiada jednorodne ubarwienie, którekontrastuje z t łem. Bardzo dobre rezultaty mo żna osi ą gn ąć podczas ś ledzenia cz ęś ci ludzkiego cia ła, na przyk ład twa-rzy lub r ęki [4].

Page 76: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 76/156

ELEKTRONIKA 3/201074

Real Time Object Tracker

Real Time Object Tracker jest systemem monitoringu za-projektowanym przez autorów do śledzenia ruchu obiektówz wykorzystaniem komputera osobistego oraz kamery prze-mys łowej [5]. W sk ład wykorzystanego sprz ętu ( rys. 1 ) wcho-dzi analogowa kamera przemys łowa CC-5299 MAFS/M dzia-łają ca w standardzie PAL. Kamera ma regulowan ą ogniskow ą (3,9...15,3 mm) oraz k ą t widzenia (49,6…2,5º) i jest zamon-

towana na obrotnicy umo żliwiają cej obrót o 355º w pozio-mie oraz 100º w p łaszczy źnie pionowej. Pr ędko ść obrotowawynosi 5º/s. Sygna ł z kamery jest przesy łany do komputeraosobistego wyposa żonego w kart ę wideo (ang. frame grab-ber ), która dokonuje konwersji sygna łu do postaci cyfrowej.Nastawy kamery oraz obrotnicy s ą sterowane z komputeraza pomoc ą sterownika SOT-5, pod łą czonego przez konwerterRS232/485. Komunikacja odbywa si ę z wykorzystaniem pro-toko łu PelcoD [10].

obiekt zbli ża si ę do kraw ędzi ekranu, pozycja kamery jestautomatycznie korygowana obrotnic ą tak, aby cel nie wy-szed ł poza kadr.

Uzyskana jako ść śledzenia dla algorytmu CAMSHIFT jestzadowalaj ą ca. Oprogramowanie umo żliwia pod ążanie nawetza szybko poruszaj ą cym si ę obiektem, dopóki obiekt znaj-duje si ę w kadrze. Rzeczywistym ograniczeniem jest tylkomaksymalna pr ędko ść obrotnicy. Program poprawnie śledzi ł obiekty, których kszta łt i wielko ść zmienia ły si ę ze wzgl ędu

na obroty i zbli żanie lub oddalanie si ę (rys. 2 ). Najwi ększymproblemem okaza ł si ę wp ływ nat ężenia świat ła. Przy s łabymoświetleniu algorytm szybciej gubi ł ś ledzony obiekt. Wygl ą dobiektu równie ż mia ł wp ływ na ś ledzenie. Im bardziej jed-norodny kolorystycznie by ł obiekt, tym precyzyjniejsze by łośledzenie. Na wyniki wp ływ mia ł tak że kolor t ła, szczególniegdy by ł zbli żony do koloru śledzonego obiektu. Ograniczeniealgorytmu CAMSHIFT, polegaj ą ce na wykorzystaniu jedyniekoloru do śledzenia obiektu, wyklucza wykorzystanie kamerczarno-bia łych lub kamer pracuj ą cych w zakresie podczer-wieni.

Wymagania sprz ętowe programu Real Time Object Tra-cker nie s ą wygórowane. Średniej klasy komputer osobisty

(Pentium 2,4 GHz) wyposa żony w kart ę wideo wystarcza dośledzenia w czasie rzeczywistym. Przy pe łnej pr ędko ści 25klatek na sekund ę, pobieranie obrazu, przetwarzanie go i śle-dzenie obiektu obci ąża procesor w ok. 50%.

Rys. 1. System automatycznego monitoringu do ś ledzenia obiek-tów w czasie rzeczywistym

Fig. 1. Real-time automatic object tracking CCTV system

Rys. 2. Śledzenie poruszaj ą cej si ę osobyFig. 2. Tracking of a moving person

Krytyczn ą cz ęścią systemu jest oprogramowanie dokonu- ją ce analizy sygna łu wideo i steruj ą ce nastawami obrotnicyi kamery. Oprogramowanie dzia ła w trzech etapach. W pierw-szym etapie jest dokonywana inicjalizacja sprz ętu. Polegaona na skon gurowaniu wej ścia wideo i portu szeregowegodo komunikacji z kontrolerem. W drugim etapie jest wy świet-lany obraz z kamery oraz okno panelu sterowania pozwala-

ją cego na r ęczne kontrolowanie kamery. Domy ślną metod ą jest automatyczne śledzenie obiektu. Trzeci etap polega nawybraniu parametrów dla algorytmu (liczba iteracji, warto ść progowa) i zaznaczeniu obiektu do śledzenia.

Oprogramowanie implementuje dwa algorytmu śledzeniaruchu – metod ę Horn’a i Schunck’a oraz algorytm CAMSHIFT.Pierwsza z metod, jak wspomniano wcze śniej, bazuje na rów-naniu przep ływu optycznego. Algorytm poszukuje pola ruchu,które spe łnia równanie z minimaln ą wariancj ą wektorów ruchupomi ędzy pikselami [29]. Druga metoda bazuje na algorytmieMeanShift i wykorzystuje charakterystyk ę barwn ą śledzonegoobiektu.

W celu rozpocz ęcia ś ledzenia obiektu za pomoc ą RealTime Object Tracker przy u życiu algorytmu CAMSHIFTużytkownik musi wybra ć obiekt, rysuj ą c prostok ą t wokó ł obiektu. Nast ępnie aplikacja wyznacza histogram koloróww zaznaczonym obszarze i rozpoczyna ś ledzenie obiektu.

Dokonuje tego poprzez obliczenie prawdopodobie ństwaznalezienia obiektu w danym regionie klatki wideo, bazuj ą cna histogramie kolorów ś ledzonego obiektu. W ka żdej kolej-nej klatce jest wyznaczana bie żą ca pozycja obiektu. Kiedy

Oprogramowanie zosta ło napisane dla systemu operacyj-nego Linux z j ą drem w wersji 2.6. Do pobierania obrazu z kar-ty wideo zosta ł wykorzystany interfejs Video4Linux. Interfejsużytkownika zosta ł zaprojektowany przy pomocy środowiskaGlade, natomiast do przetwarzania obrazu wykorzystano al-gorytmy z biblioteki OpenCV. Oprogramowanie wymaga za-instalowania biblioteki GTK+ oraz bibliotek do komunikacji zapomoc ą portu szeregowego [15].

Wnioski

Opracowany system do śledzenia obiektów w czasie rzeczy-

wistym by ł testowany w ró żnych warunkach o świetleniowych,o ró żnych porach dnia i przy ró żnych warunkach pogodowych.Użyteczno ść i skuteczno ść jego dzia łania zosta ła w pe łni po-twierdzona.

Page 77: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 77/156

ELEKTRONIKA 3/2010 75

Nie zaobserwowano programowych ogranicze ń co dopr ędko ści śledzonego obiektu. Jedynym ograniczeniem jestpr ędko ść obrotnicy, na której jest zamontowana kamera. Jed-nak że nawet powolny obiekt mo że zosta ć zgubiony, je śli niema wystarczaj ą cego kontrastu z t łem lub je śli oświetlenie jests łabsze ni ż pozwala na to czu łość kamery.

Praca jest wspó ł nansowana z projektów INDECT i 93-182/10 DS.

Literatura [1] Abidi M. A., Gonzalez R. C.: Cloud Motion Measurement From

Radar Image Sequences. Proc. of SPIE Conf. Digital ImageProcessing and Visual Comm. for Technologies in Meteo., vol.846, pp. 54-60, Cambridge, MA, 1987

[2] Andrews R.J., Lovell B.C., Color Optical Flow, Proc. of the Work-shop on Digital Image Computing, vol. 7, pp. 135-139, Brisbane,2003.

[3] Antonakos J.: Image Processing Fundamentals. Circuit Cellar,12/2001.

[4] See A. K. B., Kang L. Y.: Face Detection and Tracking UtilizingEnhaces CAMShift Model. International Journal of InnovativeComputing, Information and Control vol. 3 nr. 3, 2007.

[5] Paw łowski P. i. in.: Real-time object tracking using motorizedcamera. IEEE Signal Processing Conference SPA 2009 , Pozna ń

2009, pp. 225-228. [6] Bradski G. R.: Computer vision face tracking for use in a percep-tual user interface. Intel Tech. J., 2, 1998.

[7] Bradski G.: Computer Vision Face Tracking For Use in a Percep-tual User Interface, Microcomputer Research Lab, Santa Clara,CA, Intel Corporation, Intel Technology Journal Q2 1998.

[8] Bruhn A., Weickert J.: Lucas/Kanade Meets Horn/Schunck,Combining Local and Global Optic Flow Methods. InternationalJournal of Computer Vision 61(3), 2005.

[9] Comaniciu D.: Mean shift. A robust approach toward featurespace analysis. IEEE Transactions on Pattern Analysis and Ma-chine Intelligence, 24:603–619, 2002.

[10] Delta, PELCO-D protocol description in SOT-5. http://www.delta.poznan.pl/

[11] Fukunaga K., Hostetler L. D.: The estimation of the gradient ofa density function, with applications in pattern recognition. IEEE

Transactions on Information Theory, 21:32–40, 1975.[12] Goldenberg R. i in.: Behavior Classifcation by Eigen-decomposi-

tion of Periodic Motions, Pattern Recognition vol. 38, Issue 7,2005, pp. 1033-1043.

[13] Guerra-Artal C. i in.: A C80 DSP-based Active Vision System forReal-Time Tracking. 9th Int. Conf on Signal Processing Applica-tions & Technology (ICSPAT’98), 1998.

[14] Gyaourova A., Kamath C., Cheung S. C.: Block Matching for Ob- ject Tracking, Lawarence Livermore National Laboratory, UCRL-TR-200271, 2003.

[15] The GTK+ Team. Dokumentacja GTK+, http://www.gtk.org/docu-mentation.html

[16] Horn B. K. P., Schunck B. G.: Determining optical ow. Institutereport AIM-572. Arti cial Intelligence Laboratory, MassachusettsInstitute of Techn., 1980.

[17] Illisis Inc.: An introduction to IntelliVIX-SDKfor TI DaVinci DSPs.http://www.illisis.com, 2007.

[18] Intel Corporation. OpenCV homepage http://opencvlibrary.sourceforge.net/

[19] Kalman R. E.: A new approach to linear ltering and predictionproblems. Trans. ASME – J. Basic Engineering, vol. 82, pp. 35–45, March 1960.

[20] Li J., i in.: Color Based Multiple People Tracking. Robotics AndVision (7th. ICARCV), 2002.

[21] Lucas B., Kanade T.: An iterative image restoration techniquewith an application to stereo vision. Proceedings of the DARPAIU Workshop, pp. 121–130, 1981.

[22] Lucena M., Fuertes J.M., Perez de la Blanca N.: Using OpticalFlow for Tracking, chapter in Progress in Pattern Recognition.Speech and Image Analysis, 2003.

[23] Menezes P., Barreto J. C., Dias J.: Face Tracking Based onHaar-Like Features and Eigenfaces. The 5th Symp. on Intelligent

Autonomous Vehicles, IAV 2004.[24] Monnet A. i in.: Background Modeling and Subtraction of Dynam-

ic Scenes. Siemens Corporate Research, 9th IEEE InternationalConference, 2003.

[25] Pisarevsky V.: Introduction to OpenCV. Intel Corp., http://unjobs.org/authors/vadim-pisarevsky, 2008.

[26] Pisarevsky V.: OpenCV Object Detection: Theory and Practice.Intel Corporation, OpenCV Object Detection: Theory and Prac-tice, 2008.

[27] Smiatacz M.: Automatyczna lokalizacja, śledzenie obiektów naobrazie. http://www.eti.pg.gda.pl, 2005.

[28] Smiatacz M.: Prototypowy system analizy ruchu obiektów.Zeszyty naukowe Wydzia łu ETI Politechniki Gda ńskiej, 2006.

[29] Murat Tekalp A.: Digital Video Processing, Prentice Hall. Inc., Up-per Saddle River, NJ 07458, 1995.

[30] Wang Y. K., Tu G. F.: Fast Binary Block Matching Motion Estima-tion using One-Bit Transform. The Graduate School of AcademiaSinica, Beijing, China.

[31] Wong K.Y., Spetsakis M.E.: Tracking, segmentation and opticalow. In: Proc. 16th Internat. Conf. on Vision Interface, 2003, pp.

57-64.[32] Yilmaz A., Li X., Shah M.: Object Contour Tracking Using LevelSets. Asian Conference on Computer Vision, ACCV 2004.

[33] Yokohama M., Poggio T.: A Contour-Based Moving Object De-tection and Tracking. 2nd Joint IEEE International Workshop,2005.

[34] Zelnik-Manor L.: The optical ow eld. http://www.ee.technion.ac.il, 2004.

[35] Zelnik-Manor L.: PCA: Eigenfaces and Fisher discriminant. http://www.ee.technion.ac.il, 2009.

Page 78: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 78/156

ELEKTRONIKA 3/201076

Data hiding is one of the most dynamically developing areasof the signal processing technology. A digital acoustic water-mark with dedicated data payload is hidden in the originalhost signal in order to be perceived by the Human AuditorySystem. This paper presents a method for decoding (extract-ing) watermark from the original host signal by means of co-herent averaging of the watermarked signal spectrum. One ofthe methods for reduction of noise in the acoustic signal withperiodical character is coherent averaging of the signal fre-quency spectrum [1][5][6]. During coherent averaging of the

signal spectrum all artefacts and noise-like components areeffectively reduced, depending on the base parameter, i.e. thenumber of averaging frames (iterations). Therefore also theoriginal host signal may be reduced if the embedded low en-ergy watermark signal is of periodical character. Unfortunatelyin real signals, e.g. occurring in radio communications, it is notpossible to achieve the coherent averaging conditions on thedecoder output, which results in a decreasing coherent gain(SNR coh ) and lower effectiveness of signal decoding. The lab-oratory experiment has proven effectiveness of the proposedangle phase frequency offset reduction procedure in reducingphase drift in watermarked signal. The angle phase frequencyoffset reduction procedure enables signi cant improvement ofthe audio watermark extracting and decoding process, e.g.in audio tracks [2][3][4]. Digital watermarking scheme usesa coder and decoder of digital signature. Digital signature ismapped into additional signal. Additional signal (watermark)consists of several harmonics. Additional signal is added tothe host one and nally, at receiver side, the binary pattern isdecoded (extracted).

Spectrum coherent averaging

The watermark receiver uses the spectrum coherent ave-raging of the watermarking signal as the base mechanism,which results in “picking out” of a periodically repeated wa-termark signal. The coherent averaging method is used forSignal–to-Noise ratio (SNR) improvement and consists in rstsumming up of a repeated spectrum and then averaging theoutput signal. The signal with noise component is expressedas [1]: (1)

where c (n) is a set of samples degraded by noise for n-th fra-me, original host audio signal with determined amplitude, pe-riodically repeated (by n frame), niose (n) – n-th noise frame.

If M separately repeated sets of samples (frames) are ave-raged, where k is dedicated averaging sample, then:

(2)

Output deviation δmean for sequence c ˆ (k ) depends on de-viation δhost of the frames series and is expressed as:

( ) )(nnoise ync +=

( ) [ ]( )∑= +−=

M

n nM k cM k c 1 11

ˆ

(3)

Therefore, the measurement uncertainty can be decreased bythe output deviation decreased after the averaging process.There can be a considerable y signal where represents δhostthe standard deviation of the noise:

(4)

In case of an averaged signal:

(5)

Therefore, the output gain is expressed by the following for-mula:

(6)

The determined gain ratio in logarithmic scale for M xednumber of iterations is expressed as:

(7)

Within the scope of frequency, coherent averaging means se-parate averaging of real and imaginary part of the successivespectral lines. Output set F coh of the complex values of spectrallines results in coherent averaging of the signal, e.g. for a gi-ven spectral line N – 1 we can create the following formula:

(8)

When the condition of angle phase conformity for dedicatedspectral line is not satis ed in every repeated frame, there isno coherence, therefore ratio SNR coh ≈ 0. We can create thefollowing formula:

(9)

Where: A s.bin – amplitude of spectral line in dedicated FFT binnoise s.bin – noise envelope in dedicated FFT bin Therefore,when the conformity with phase is ful lled, the SNR coh ratiowill increase by decreasing noise deviation during the com-

plex spectrum averaging. The term conformity with phase canbe de ned as complying with the same angle phase conditionfor given spectral line at the beginning of every FFT frame(Fig.1 ).

M host

mean

δ δ =

host host

ySNR

δ =

meancoh

ySNRδ

=

M M

SNRhost

host coh ==

/δδ

( ) ( )( ) ( )M M

SNRdBSNR cohcoh

1010

10

log10log20

log20

==

==

( ) ( ) ( ) ( )

( ) ( )k

N F N F N F

k N F N F N F

coh

k

k

j

N F ImIm2Im1

ReRe2Re1

1...)1(1

1...111−++−+−

−++−+−

+

=−

( )bin s

bin snoise

AcohSNR

.

.10log20=

Effectiveness of the frequency offsetcomputation procedure

(Efektywno ść procedury wyznaczania poprawki k ą ta fazowego)

dr in ż. ZBIGNIEW PIOTROWSKI

Wojskowa Akademia Techniczna, Wydzia ł Elektroniki, Instytut Telekomunikacji, Warszawa

Page 79: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 79/156

ELEKTRONIKA 3/2010 77

Time shifting equals phase shifting in FFT domain, therefore:

(10)

where: x (t ) is de ned as: x (t ) = X( j ω )

Frequency offset computation procedure

In order to ful l the coherence condition it was necessaryto propose the algorithm for estimation and reduction of thephase drift at receiver side of the telecommunication channel[2], which results from varying oscillator stability. These oscil-lators drive A/D and D/A converters of e.g. radio transmitterand receiver in radio link during real-time speech transmis-

sion. It has been proven that these converters, when opera-ting at declared sampling frequency f s cause undesired phasedrift (constant phase shift) at the link output. Such phase driftshould be corrected to ful l the angle phase coherency con-

( ) ( )ωω j X et t x t j 00

−=−

dition during the watermark averaging process of successivesignal’s frames.

The proposed method [2] provides phase drift estimationfor analysis of signal in the frequency domain at resolutionηscan = 0.08ppm in the output angle phase drift range from

– 160ppm up to 160ppm.The proposed method is based on a virtual spectral line

analysis formed as the sum of N (in N=6 implementation) de-dicated spectral lines referred to as pilots . Pilots have xed

amplitudes in dedicated spectral bin, therefore:

(11)

Where: F ν – virtual spectral line value, F i χ – complex value ofi-th spectral line pilots . It was assumed that:

(12)

F i χ is computed by averaging (M iterations) a spectral line va-lue of the same spectral index [ i]. The complex value of FFT

is averaged separately both for real and imaginary parts in thexed reduction coef cient χ for M iteration. Therefore we tryto receive the maximum value of the absolute virtual spectralline:

(13)

In case of watermarked signal averaging with dedica-ted reduction coef cient χ chosen from the set of values χ

range {– χ

min , χ max }. When we receive the maximum value of

F ν max module computed from the set of χ range we can determine

the correct χ value in [rad] as a reduction coef cient for driftreduction. The iterative procedure consisting in selecting pha-se angle values from the set of χ

range is divided in two parts:

rough and precise scanning, in order to decrease the numberof iterations and the computation time. During the averagingprocess the chosen value χ is constant for the set of M frameiterations.

Phase drift reduction procedure

In drift reduction procedure phase_correct the current valueof the angle phase is corrected for chosen spectral lines and χ values. If c (n) is an output watermarked signal (original hostaudio signal with watermark signal) then:

(14)

Rough scanning block results in a pair of reduction coef -cients of the angle phase values matched with the maximumabsolute virtual spectral line value. The positive and negati-ve values are computed separately on the basis of the set{– χ

min , χ max }. The precise scanning results in the maximum

global χ value, selected from local positive and negative ma-xima.

Angle phase reduction coef cient computation

The angle phase reduction coef cient (allowance) for the out-put signal is de ned in [rad/frame] for the rst harmonic of

( )( )∑=

= N

iiv F abs F

( ) ( )∑ ∑

= =

+=M

k

M

k ik ik i F F F

1 1

ImReχ

( )( )∑=

= N

iiv F abs F

1

max( χ

[ ] ( )χ, _ ,...,1 ccorrect phase F F N =

( )( )ik c fft fft all :, _ =

( ) ( )( )( )χ−= angle jik fft all abs F temp *exp*.,1 _ 1

( ) ( )( )( )χ−= angle jik n fft all abs F Ntemp *exp*., _

temp F F F 111 += Ntemp N N F F F +=

Time

30 deg

8 deg

64 deg

Frequency

A m p l i t u d e

Time

A m p l i t u d e

Frame 1

Frame 2

30 deg

8 deg

64 deg

Frequency

A m p l i t u d e

A m p l i t u d e

coherent averagingFrame 1

Frame 2

Time

35 deg

13 deg

69 deg

Frequency

A m p l i t u d e

Time

A m p l i t u d e

Frame 1

Frame 2

30 deg

8 deg

64 deg

Frequency

A m p l i t u d e

A m p l i t u d e

incoherent averaging

5 deg

Frame 1

Frame 2

Fig. 1. Coherent and incoherent averaging (frame shift 5 deg)Rys. 1. U ś rednianie koherentne i niekoherentne (przesuni ę cieramki o warto ść 5 stopni)

Page 80: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 80/156

ELEKTRONIKA 3/201078

the signal ( 1st har ). This is useful during drift reduction of theoutput signal. For example, for A reduction coef cient:

f s = 44100 [Hz] – sampling frequencysa number = 384 – number of samples in framef SMIQ = 24580600 [Hz] – SMIQ signal generator frequency(Hewlett-Packard SMIQ type generator is driving A/D convert-er of the audio PC card)

fr number = f s /384=114.8438 – number of frames per 1 second ofanalysed signalf 1har = ( f s /2)/192 – 1 st harmonic frequency of analysed signalf31har = f 1har* 31 – 31 st harmonic frequency of the analysedsignalWe can compute the following parameters:

A sec = A · fr number = –7.339 · 10 -4 [rad/s] Adec = ( A sec · 360)/(2 · )= –0.042 [deg/s]Drift rad = ( A sec · f SMIQ )/ f 1har = –157,0799 [rad/s]Drift Hz = Drift /(2 · ) = –25 [Hz]Drift ppm = ( Drift Hz /f SMIQ ) · 1 · 10 6 = –1,0171 ppm

Based on the above calculations, determined the reduction

coef

cient A for output Hewlett-Packard SMIQ type generatorfrequency f outSMIQ equals:

[15]

Now, let’s compute the parameters for 31 st harmonic of theanalysed signal:

A31 = ( A · f31har)/ f 1har = –1,981 · 10 4 [rad/ frame 31 st.har ] A sec = A 31 · fr number = –0,0228 [rad/s] Adec = ( A sec · 360)/(2 · ) = –1,3035 [deg/s]Drift ppm = –1.0171 ppm

Therefore, the Hewlett-Packard SMIQ type generator outputbase frequency out of tune with value results after 1 second atthe last 31 st harmonic of the watermark signal the phase angleshift equals –1,3035 degree. In the correction block the driftreduction is carried out using computed χ = A value in [rad/frame 1st.har ] in accordance with the formula (14). Then the co-herence condition is ful lled and by summing up the spectrumframe-by-frame we can decode watermark frequency spectralline pattern.

Experiments – frequency offset reductionprocedure effectiveness

For xed SNR =10 dB, the value of the reduction coef cientwas computed in function of the signal generator frequency.This signal was driven the A/D converters in audio PC cards.The experiment was carried out for watermark signal combtype [track duration time: 10 second] and watermarked sig-nal (audio pop music with embedded watermark signal) 001_ RS403 [track’s duration time: 10 sec, 20 sec, 30 sec] withdedicated test bed con guration.

Figures 3 presents the two steps of nding the drift value.Testing signal watermark comb for critical maximum value -159,72 ppm (theoretical value for 1 st harmonic: -0,0010048rad/frame and found by frequency offset reduction procedure:-0,001003 rad/frame). Absolute value of virtual spectral lineequals 8345,8557.

In Fig. 4 the error reduction coef cient analysis was carried

out in the function of out-of-tune frequency Hewlett-PackardSMIQ type generator). We denote: t – theoretical computa-tion, g6 – watermark signal comb type, RS403 pop music withembedded watermark. Tracks’ duration time – 10 seconds.

]/[103904,6 .16

har st framerad A −−=

][245805752524580600 Hz Drift f f Hz SMIQSMIQout =−=+=

Fig. 2 Designed reduction range for frequency offset reductionprocedure (deg/s) computed for 31 st harmonic and 384 pts FFT(algorithm no use FFT standard resolution 256 or 512 pts)Rys. 2 Projektowany zakres redukcji w procedurze redukcji prze-suni ęcia cz ęstotliwo ściowego (deg/s) wynaczony dla 31 harmo-nicznej dla 384 punktowej FFT

Fig. 3. Illustration of nding reduction coef cient (maximum driftvalue)Rys. 3. Poszukiwanie wspó łczynnika redukcji (maksymalnawarto ści dryftu k ą ta fazowego)

Fig. 4. Reduction coef cient error analysis. X-axis frequency ofHewlett-Packard SMIQ type generator (out-of-tune value), Y-axiserror in ppm. The watermark signal (comb type) has a smaller

deviation than the watermarked audio musicRys. 4. Analiza b łędu wspó łczynnika redukcji w funkcji rodza- ju sygna łu. O ś x – cz ęstotliwo ść sygna łu generowanego przezgenerator Hewlett-Packard typu SMIQ (odstrojenie od warto ścinominalnej), o ś y – b łą d w ppm

Page 81: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 81/156

ELEKTRONIKA 3/2010 79

Fig. 6. Average error of reduction coef cient estimation in func-tion of the track duration (y-axis – ppm values)Rys. 6. B łą d ś redni wyznaczonego wspó łczynnika redukcjiw funkcji d ługo ści trwania sygna łu (czasu u ś redniania koheren-tnego), o ś y – warto ści pomiaru w ppm

Fig. 5. Reduction coef cient error analysis. X-axis frequency ofHewlett-Packard SMIQ type generator (out-of-tune value), Y-axiserror in ppm. Smaller deviation is computed for watermarkedsignal with longer duration track (more M-iterations during aver-aging process, higher SNR coh gain)Rys. 5. Analiza b łędu wspó łczynnika redukcji w funkcji d ługo ścitrwania u ś redniania koherentnego (czas trwania sygna łu). O ś x

– cz ęstotliwo ść sygna łu generowanego przez generator Hewlett-Packard typu SMIQ (odstrojenie od warto ści nominalnej), o ś y

– b łą d w ppm

Conclusions

Results of the conducted experiments may be summarizedas follows:• Frequency offset reduction procedure is effective in the

wide output frequency drift within the range from -160 up to160 ppm, which results in latest 31 st harmonic out-of-tunefrom -204,97 deg/s up to 204,97 deg/s ( Fig.2, Fig. 3 ).

• Frequency offset reduction procedure is effective at a very

high resolution, in theory this value equals 0,08ppm, andtakes effect in possible angle phase correction on the last31st harmonics of signal equals 0,1deg/s (!).

• The real reduction coef cient (allowance) depends on thetype of signal (both: watermark and watermarked signalwere tested), number of averaged frames, sampling fre-quency and the output stability of the sampling converteron the receiver’s side (it is assumed that on the transmitterside we have high stability Hewlett-Packard SMIQ type ge-nerator).

• The average reduction coef cient error is decreasing withan increase of duration of averaging ( Fig.5,Fig. 6 ).

• The average reduction coef cient error is smaller for

“comb” type signal then for watermarked signal (audio hostsignal with embedded watermark), Fig. 4.• Frequency offset reduction procedure is effective in te-

lecommunication equipment, provided there is a short-term high stability generator assumed at the transmitter’sside.

References

[1] Lyons R.: Wprowadzenie do cyfrowego przetwarzania sygna łów.WKŁ Warszawa 1999.

[2] Piotrowski Z.: Effective method of the watermark embedding anddecoding in the broadcast audio signal band. Ph. D. thesis, Mili-tary University of Technology, Warsaw, 2005.

[3] Piotrowski Z., Gajewski P.: The information hiding methods inacoustic signal – secure watermarking system. Conference Pro-ceedings, KKRRiT 2004, Warsaw, 16-18 June 2004.

[4] Gajewski P., Łopatka J., Piotrowski Z.: A new method of fre-quency offset correction using coherent averaging. Journalof Telecommunications and Information Technology, 1/2005,pp. 142-146, Warsaw 2005.

[5] Gajda J., Sroka R.: Pomiary k ą ta fazowego – Metody – Uk łady – Algorytmy. AGH, Kraków 2000.

[6] Zieliński T.: Cyfrowe Przetwarzanie Sygna łów Od teorii dozastosowa ń. WKŁ, Warszawa 2005.

Przypominamy o prenumeracie miesi ęcznika Elektronika na 2010 r.

Page 82: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 82/156

ELEKTRONIKA 3/201080

Cardiovascular system diseases are responsible for over 7 mil-lion premature demises in the world per year. One of the mainfactor of cardiovascular risk is hypertension leading, amongothers, to left ventricle rebuilding. Therefore measurement ofleft ventricle shape in ultrasound B mode examination is rec-ognized as one of the main medical noninvasive examination

aiming at estimation of the heart state and cardiovascular risk.Problem of ef cient segmentation and tracking left ventricle inultrasound images is widely reported in literature [1-13].

In this paper novel usage of the level set method [14] tothe heart segmentation is presented, the rst step leading to-wards segmentation of the left ventricle. Typically, in this caseapplication of the active contours/shape segmentation tech-nique is reported [2, 7, 9, 10, 13]. In our approach, rst theregion of interest is found using the linear Hough transform.Then, the speckle reduction anisotropic diffusion (SRAD) l-ter [15] is used. Finally, image segmentation via the level setmethod [14] is done. In order to validate the proposed USGdata processing methodology, initially the method is tested onarti cially generated USG-like images that are embedded inspeckle noise simulated using approach described in [16].

Calculation of region of interestDue to echocardiogram (ECG) image structure, in the begin-ning it is necessary to calculate Region of Interest (ROI) whichallows to limit segmentation area only to pixels representing in-formation coming from a USG sensor. ROI is limited by two linesand an arc in the bottom and prevents miss-segmentation in thebackground area (see Fig. 2 ). Its calculation is required becau-se of similar intensity value of the background and a searchedobject, especially, in case of objects which do not have bordersfrom one image side. ROI boundary lines are calculated afterimage thresholding (threshold=30). After this operation, boun-dary between pixels equal one and pixels marked as zero isdetermined. Next, linear Hough transform is computed on imageprepared this way using parametric representation of a line:

(1)

The result is presented in Fig. 1 . In the transform coef cientsspace two peaks with opposite sign and maximum value areselected. Since angles of the searched lines are approxima-tely known, we could limit the searching range: +/ − 20 to 70degrees. Having the peaks detected, we can calculate linesequations.

In the next step, coordinates of lines intersection are takenas an arc centre. The radius length is calculated using imageafter thresholding: maximum distance from the centre of arcto pixels with intensity equal 1 gives the radius length. Coordi-

)sin()cos( θ θ ρ y x +=

nates of the arc centre and its radius allow to calculate the arcequation. Result of using the proposed automatic procedurefor ROI calculation is shown in Fig. 2 .

Level set based automatic segmentationof ultrasound echocardiographic images

(Automatyczna segmentacja echokardiogramów wykorzystuj ą cametod ę zbiorów poziomicowych)

dr in ż. ANDRZEJ SKALSKI 1

, prof. dr hab. in ż. TOMASZ P. ZIELI ŃSKI2

,dr in ż. PAWE Ł TURCZA 1,1 Akademia Górniczo-Hutnicza w Krakowie, Katedra Metrologii

2 Akademia Górniczo-Hutnicza w Krakowie, Katedra Telekomunikacji

Fig. 2. Results of automatic ROI calculation (two white lines andan arc)Rys. 2. Wynik zastosowania automatycznej metody wyznaczaniaobszaru zainteresowa ń (dwie bia łe linie oraz łuk)

Fig. 1. Example of Hough transform of an ECG image: black dotsrepresent points selected by the algorithm, which specify theROI linesRys. 1. Przyk ład transformacji Hough’a dla obrazu USG: czarnekropki przedstawiaj ą punkty wybrane przez algorytm, które po-zwalaj ą wyznaczy ć ROI

Srad adaptive ltering procedure

Luminance of USG images is usually described by the follo-wing mathematical model:

(2)( , ) ( , ) ( , ) g x y u x y f x y=

Page 83: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 83/156

ELEKTRONIKA 3/2010 81

where u( x , y ) and f ( x , y ) represent multiplicative noise and sig-nal samples, respectively, for image coordinates ( x , y ). Valuesof these samples are modeled by random statistically-indepen-dent variables, i.e. E[ u( x ,y )f ( x ,y )] = = E[ u( x ,y )]E[f ( x ,y )]. Additio-nally, stationary model is assumed for noise described by itsmean value and variance σu

2 . Adaptive removing the multiplicative noise u( x , y ) from the

USG signal g ( x , y ) is possible when (2) is re-written into thefollowing signal + noise form [17]:

(3)

where n( x , y ) = [u( x , y )−1)]f ( x , y ) represents additive noisedepending on signal f ( x , y ). Application of the linear minimummean square error (LMMSE) estimator

(4)

to (3) leads to the following ltering equation [17]:

(5)

where σf 2

and σg 2

denote variances of the original signal f( x ,y )and observed noisy signal g ( x ,y ) that should be estimated.Making use of variance de nition and assumed statistical in-dependence of signal and noise we get [18]:

(6)

where

g denotes the mean value of the intensity within the local lterwindow position. Value C u

2 represents normalize local varian-ce of the multiplicative noise, it is constant, due to the noisestationarity assumption, and can estimated using smooth (i.e.without edges) fragment of the USG image. In turn, value C g

2 represents normalize local variance of the signal and is esti-mated using small neighborhood of the actually processed pi-xel (usually 4 neighboring pixels). When the actual pixel hasneighborhood without edges, the ratio C u

2/C g 2 is close to 1 and

the pixel is replaced by the local mean value what causes noi-se reduction. In case of edge occurrence, averaging operationhas a smaller weight what prevents smoothing and shiftingedges existing in the original image.

Operation (6) can be performed iteratively (many times)on an image. In such case it should be re-written into the form[15]:

( , ) ( , ) [ ( , ) 1] ( , ) g x y f x y u x y f x y= + −

1 0ˆ f a g a= + ,

2

2ˆ ( ) f

g

u f f g g

σσ

= + −

[ ]2 2

2

11 1ˆ ( ) ( )1

u g

u

C C f g g g g k g g

u C u

−= + − = + − +

2 2 2/u uC uσ=

2 2 2/ g g C g σ=

(7)

where I t +∆t and I t correspond to f and g in (6), respectively, andthe normalized factor 1/ u is neglected since it has the constantvalue and does not in uence the edge detection process. Af-ter assumption that expected value of I can be calculated bymeans of 4 neighboring image pixels and usage of discreteapproximation of Laplacian, equation (7) can be written in theform of well-known Perona-Malik modi ed nonlinear diffusion

lter [19]:

(8)

where div denotes divergence and is an image gradient.The Perona-Mallik lter is very popular due to the fact that itallows image denoising while simultaneous sharpening edgesand precisely preserves their positions. Further source infor-mation concerning newer application of diffusion lters forspeckle denoising can be found in [20, 21].

In the reported research the speckle noise has been redu-ced using equation (7) (equivalent to (8)) known as a specklereduction anisotropic lter (SRAD). Complete derivation of itsequation is given in [22].

Example of real data ltration is shown in gure 3. Filteringquality was estimated using Signal to Noise Ratio (SNR) de-ned as [23]:

(9)

where I is original image, I ltred

– image after ltration and μ I

– mean value of image I. For images presented in Fig. 3 SNRis equal 19.90 dB.

Level set based segmentation algorithm

The ECG images are segmented in our approach by means ofthe level set method introduced by Osher and Sethian [14]. Itis a good tool for modeling changing topologies since mergingand breaking are made automatically in it. This properties arevery useful in case of heart images where valves is in differentphases (open, close). Active contours implemented using le-vel set methods can be interpreted as a zero level set of timedependent function φ(t, x, y) .

( )(1 )t t t t t I I k I I +∆ = + − −

( )14

t t t t t t I I div k I +∆ ∆ = + −

∑∑

∑∑

= =

= =

−=

N

x

M

y filtred

N

x

M

y I

filtred

y x I y x I

y x I

I I SNR

1 1

2

1 1

2

10

)),(),((

)),((

log10),(

µ

[dB]

Fig. 3. Real data example a) without; b) with ltrationRys. 3. Przyk ład rzeczywistych danych: a) bez, b) oraz po ltracji

Page 84: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 84/156

ELEKTRONIKA 3/201082

In the level set method the evolution equation can be writ-ten as:

(10)

The function F is called a speed function. For images it de-pends on the function φ and image data. In this paper we usevaritional formulation of the function F proposed by Li et al.[24] where the nal evolution equation has a form:

(11)

where denotes a regularized Dirac function,,, are constantvalues and g is an edge indicator function:

(12)

f x and f y are gradient images in x and y direction. The coef -cient should take positive (negative) value when initial con-

tours are placed outside (inside) a segmented object. Sign ofcauses whether the evolution will be increasing or decreasingthe segmentation area. Limitation of evolution segmentationdirection reduce calculation time signi cantly. Additionally, inLi et al. algorithm time consuming reinicialization procedure isnot necessary. This version of level set method is called fastmarching [25]. More details can be found in [24]. In level setmethods one has to de ne an initial contour from which algo-rithm starts evaluation.

As an initial contour we propose to exploit the result of sim-ple thresholding procedure that makes use of the same thres-hold value as in ROI calculation (th = 30). In order to removesmall holes application of morphology ltering is suggested. Incase of ECG images sequence segmentation, initial contourcan be calculated based on the segmentation results of theprevious frame.

Modelling USG images

Modelling USG images is a subject widely discussed in lite-rature. Interesting references can be found in [16, 27]. Forvalidation of the proposed segmentation method we have im-plemented in Matlab B-mode echographic image acquisitionmodel proposed in [27] including:

– simulation of the sectoral scan of a plane by an ultrasonicbeam (points are scattered in polar coordinate system),

– speckle noise addition in polar coordinates system by si-mulating a random walk in the plane of the image complexamplitude, according to the Burckhardt speckle formationtaking into account origin of ultrasound echoes genera-tion,

– coming from Cartesian to polar scattering and vice versaby interpolation.Typically, embedding the normalized [0, 1] image in the

multiplicative speckle noise is done by the following equation(among others implemented also in Matlab):

(13)

where rnd denotes a random variable uniformly distributed inthe range [ −0.5...0.5). In [27] in uence of ultrasound echoes issimulated by adding to the image (written in polar coordinatesystem) the random walk of complex phasors:

0=+

∂∂

φ φ

F t

( ) ( )φ δ ν

φ φ

φ λδ φ φ

φ µφ

g g divdivt

+

+

−∆=

∂∂

221

1

y x f f g

++=

{ }2( , ) max 0, min ( , ) 12 ( , ) , 1noisy I x y I x y I x y rnd σ = +

(14)

where:

(15)

(16)

In the equations above the following denotations are done: – M ( x ,y ) is a number of random walk steps for the pixel

( x , y ), – uk ( x ,y ) and u k ( x ,y ) are, respectively, the real and imagina-

ry part of the phasor, which norm is distributed followinga gaussian law with average 0 and standard deviation σ:

(17)

and phase is random variable uniformy distributed in the ran-ge [0, 2 π ).

In Fig. 4 there are presented 6 test images, normalized inthe range [0...1], obtained from the implemented USG mo-del [27] for M ( x ,y ) being a random number from the interval[1, 20] and for σ2 = [0.1, 0.5, 1.0, 1.3, 1.6, 2]/256. We have ge-nerated images having 256×256 pixels from USG grid patternconsisting of m=128 arcs with n=64 points each. The used thefollowing values of the model parameters: the scanning angleΘ =π /3, origin height (offset) y 0 =16 pixels.

2 2Re Im( , ) ( , ) ( , )noisy I x y I x y I x y= +

( , )

Re1

( , ) ( , ) ( , )M x y

k k

I x y I x y u x y=

= + ∑

( , )

Im

1

( , ) ( , )M x y

k

k

I x y v x y

=

= ∑

2 2

222

1( , )

2

u v

g u v e σ σ πσ

+−=

Fig. 4. Images generated from the USG model; First row from leftto right: σ 2={0.1, 0.5, 1}/256; Second row: σ2={1.3, 1.6, 2}/256Rys. 4. Obrazy wygenerowane z modelu USG; Pierwszy wierszod lewej do prawej: σ 2={0.1, 0.5, 1}/256; Drugi wiersz: σ 2={1,3,1.6, 2}/256

ResultsIn this section results of using the segmentation method de-scribed in the paper are presented for arti cial images gene-rated from the model and for real ECG images. In each ex-periment the segmentation parameters were equal: μ = 0.4, λ = 1, ν = –1.5 .

In Fig. 5. one can see examples of segmentation resultsfor images generated by our model for two cases: without and

with usage of the ltration algorithm presented in section 2.For the image without ltering some pixels with higher intens-ity value lying inside the object were treated as separated en-tities.

Page 85: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 85/156

Page 86: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 86/156

ELEKTRONIKA 3/201084

[14] Osher S., and Sethian J. A.: Fronts propagating with curvaturedependent speed: algorithms based on Hamilton-Jacobi formu-lations. J. Comp. Phys. vol. 114, pp. 12-49, 1988.

[15] Yu Y., Acton S.T.: Speckle Reducing Anisotropic Diffusion.IEEE Trans. on Image Processing, vol. 11, no. 11. 1260-1270,2002.

[16] Gilliam A.D., Acton S.T.: Echocardiographic Simulation for Vali-dation of Automated Segmentation Methods. IEEE ICIP-2007,pp. V-529-532, 2007.

[17] Lee J.: Digital image enhancement and noise ltering using localstatistics. IEEE Trans. Pattern Anal. Mach. Intell., vol. PAMI-2,

no. 2, pp. 165-168, Feb. 1980.[18] Kuan D. T., Sawchuk A. A., Strand T. C.: Adaptive noise smooth-ing lter with signal-dependent noise. IEEE Trans. Pattern Anal.Mach. Intell., vol. PAMI-7, no. 2, pp. 165-177, Feb. 1985.

[19] Perona P. and Malik J.: Scale-space and edge detection usinganisotropic diffusion. IEEE Trans. Pattern Anal. Mach. Intell., vol.PAMI-12, no. 7, pp. 629-639, Jul. 1990.

[20] Aja-Fernández S., Alberola-López C.: On the estimation of thecoef cient of variation for anisotropic diffusion speckle ltering.IEEE Trans. Image Processing, vol. 15, no. 9, pp. 2694-2701, Sep.2006.

[21] Zhang F., Yoo Y-M., Koh L-M., Kim Y.: Nonlinear Diffusion Pyra-mid Domain for Ultrasonic Speckle Reduction. IEEE Trans. onMedical Imaging, vol. 26, no. 2, pp. 200-211, 2007.

[22] Turcza P.: Nonlinear image lters in detection of common carotidartery intima-media thickness. Symposium Modelling and Measure-ments in Medicine MPM-2009, Krynica Górska, 2009 (in Polish).

[23] Jab łoński B.: Image and trajectories ltration based on partialdifferential equation. EXIT, Warsaw, 2008 (in Polish).

[24] Li C., Xu C., Fox G. C.: Level Set Evolution Without Re-initialization: A New Variational Formulation. IEEE CVPR, pp. 430-436, 2005

[25] Sethian J.A.: Level Set Methods and Fast Marching Methods:

Evolving Interfaces in Computational Geometry, Fluid Mechan-ics, Computer Vision and Materials Science. Cambridge Univer-sity Press, 1999.

[26] Fenster A., Chiu B.: Evaluation of segmentation algorithmsfor medical imaging. Proceedings of the 2005 IEEE Engineer-ing in Medicine and Biology 27th Annual Conference, pages7196-7189, 2005.

[27] Perreault Ch., Auclair-Fortier M.-F.: Speckle Simula tion Basedon B-Mode Echographic Image Acquisition Model. Fourth Ca-nadian Conference on Computer and Robot Vision, CRV07, pp:379-386, May 2007.

Today there is easy access to digital audio signal sources.Most audio signal sources are digital and have analog outputsolely because of conventional systems. However, it seemsnot unreasonable to supply a digital signal directly to the loud-speaker. A block diagram of a digital power audio ampli er isshown in Fig. 1 [8, 7]. The digital audio input signal S/PDIFor AES/EBU (in the CD player standard, i.e., b = 16 bit withsampling rate f s = 44.1 kHz) is divided into two channels leftand right by a digital audio interface receiver (DAI). The nextstage is a digital pulse width modulator (DPWM).

plier through LC low-pass lter used for suppressing modu-lation harmonics. A typical audio band has a range of 20 Hzto 20 kHz.

This paper presents the realization of a modi cation ofclassical PWM, called click modulation.

Digital pulse width modulator

The classical analog pulse width modulation PWM circuit isshown in Fig. 2 . In the classical analog pulse width modulationPWM circuit ( Fig. 2 ) the conversion resolution is theoreticallyunlimited and the spectrum of modulation components de-pends only on the modulation method. In practice the conver-sion resolution is limited by component nonidealities [2,1].

A digital click modulator for a class-Daudio power ampli er

(Cyfrowy modulator typu click modulation dla elektroakustycznegowzmacniacza mocy klasy D)

dr in ż. KRZYSZTOF PIOTR SOZA ŃSKI

University of Zielona Góra, Institute of Electrical Engineering, Zielona Góra

Fig. 1. Block diagram of digital audio power ampli er Rys. 1. Schemat blokowy cyfrowego elektroakustycznegowzmacniacza mocy

DPWM

Digital SignalS/PDIFor AES/EBU

f s

D/tConverter

PulseAmplifier

DAIReceiver

f s f s = 44.1 kHz

to the secondchannel

LC PowerFilter

PowerSupplier

The modulated signal is then converted by digital-to-timeconverter ( D/t ) into signal pulses controlling the output powerpulse ampli er. The loudspeaker is connected to a pulse am-

u m(t )

+-

Comparator

Triangularsignal

generator

+U z

u in(t )

L2

C 2

L1

C 1

-U z

Level shifterand gate drivers

RL

C 3

f c

f c f c Pulse

amplifierLevel shifter

and gate drivers

Fig. 2. Simpli ed diagram of a classical analog pulse width mo-dulation PWM circuitRys. 2. Uproszczony schemat klasycznego analogowego uk ładuz modulacj ą szeroko ści impulsu (PWM)

Page 87: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 87/156

ELEKTRONIKA 3/2010 85

The simpli ed block diagram of DPWM digital-to-time con-verter is depicted in Fig. 3 . The output time pulse is generatedby a digital comparator connected to a period counter and in-put digital signal.

If the digital input signal has a bigger value than the currentvalue in the period counter then the output signal q(t ) is high,otherwise it is low. The period counter clock frequency can beexpressed as

(1)

where: f c – transistor switching frequency, b – number of bit.For the case in consideration, for f s = 44.1 kHz and

b = 16 bit, the value of the period counter clock frequencyis f Mclk ≈ 2.89 GHz. It is too high even for modern standardintegrated circuits. Therefore the digital input signal should bequantized. For a given maximal period the counter clock fre-quency bit rate can be calculated as:

b

cMclk f f 2= ,

with a noise level around 80 dB. It is possible to suppress thisnoise by using a noise shaping technique [8, 7].

In both cases there are intermodulation components: f c ± 2 f ,f c ± 4 f , f c ± 6 f … The components: f c – 4 f = 18432 Hz andf c – 6 f = 11264 Hz are in audio band. This is the main disadvan-tage of DPWM modulation, i.e., the transistor switching freque-ncy must be much higher than the end of the audio band [2].

Click modulation

Click modulation is a coding technique developed in the 80s byLogan [3] to retrieve information encoded by the zero crossingsof certain bipolar signals. Using click modulation it is possibleto remove modulation components from the signal band to thehigh frequency band. Therefore the demodulation process canbe easily performed by low order low-pass LC lter. Click modu-lation is also called zero position coding (ZePoC) [3, 6, 10, 4].

The block diagram of the click modulation algorithm isshown in Fig. 5 . Given a band limited pass-band-like signalf (t ) with spectral content con ned to ( f L … f H), where 0 < f L < f H< ∞, the signal f (t ) has zero value DC component.

Input signal is transformed to analytic signal f A(t ) by Hilbert

transformation: the analytic signal

(3)( ) ( ) ( )t f t f t f A ˆ j+= ,

Fig. 3. Simpli ed block diagram of DPWM digital-to-time conver-ter Rys. 3. Uproszczony schemat blokowy cyfrowego modulatoraDPWM

(nT s)

Periodcounter

Comparator Quatizer

Clock generator

b bq

f Mclk

f s f c=f s

q(t ) xq(nT s)

Fig. 4. Spectrums for DPWM: a) f c = 2^15 Hz, b q = 7 bit, f = 3.584 kHz,b) f c = 2^15 Hz, b q =12 bit, f = 3.584 kHzRys. 4. Widmo amplitudowe dla DPWM: a) f c = 2^15 Hz, b q = 7 bit,f = 3.584 kHz, b) f c = 2^15 Hz, b q =12 bit, f = 3.584 kHz

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 10 4

-100

-80

-60

-40-20

0

Frequency [Hz]

M a g n

i t u d e [

d B ]

a)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 10 4

-100

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

b)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 10 4

-100

-80

-60

-40-20

0

Frequency [Hz]

M a g n

i t u d e [

d B ]

a)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 10 4

-100

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

b)

(2)

For modern integrated circuits a value of switching freque-ncy f Mclk = 200 MHz is usual, hence the number of bits for theabove data is bq = 12.

Spectrums of DPWM simulation for f c = 2^15 Hz, andf = 3.584 kHz, are presented in Fig. 4, while Figure 4a showsa DPWM spectrum for b q = 7 bit, with the quantization noiselevel around 60 dB. Fig. 4a shows a spectrum for b q = 12 bit,

2log

log

≤ c

Mclk

q

f f

b .

Fig. 5. Block diagram of click modulation algorithmRys. 5. Schemat blokowy modulatora typu click modualtion

Hilbe rt

+ AEM

x x(t )

f (t )T

^f ( t )

f (t )

h a( t )

h a( t ) x y(t )

xf (t )

yf (t )

s(t )q(t )

cos(2π f ct )

sin(2π f ct )

where: (4)

In the next stage analytic signal is converted through an ana-lytic exponential modulator AEM:

(5)

where: (6)

and: (7)

The signal z (t ) is also analytic. In the following stage it is ltered by low-pass lter h a(t ). Discussion of the lter parame-ter is available in [6, 9, 10]. The real-valued signal s (t ) de nedby:

(8)

Finally, the binary signal with separated baseband q(t ) is pre-

pared from s (t ) by:

(9)

( ) ( )t

t f t f π1ˆ = .

( ) ( ) ( ) ( )t f t f t f et z A jˆ je −− == ,

( ) ( ) ( )t yt xt z j+=

() ( )( ) ( ) ( )( )t f t yt f t x t f t f sine ,cose )(ˆ)(ˆ −== .

( ) ( ){ } () ( ) ( ) ( )t f t yt f t xt z t s cct f c π2sinπ2coseRe π2 j +== − .

( ) ( )( ){ } ( )( ){ }t f t st q cπ2sinsgnsgn2

−= π .

Page 88: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 88/156

ELEKTRONIKA 3/201086

The spectrum of click modulator output signal q(t ) is shownin Fig. 6 . The spectrum consists of two bands: signal band andhigh frequency modulation component band. The high freque-ncy band is suppressed by analog low-pass LC output lter.

Realization of click modulator

The block diagram of the laboratory experimental circuit isshown in Fig. 7 . In this circuit for simplicity an analog input

is used.

The block diagram of digital signal interpolator is shownin Fig. 9.

The input signal sampling rate is expanded by interleavingR -1 zero samples between every input sample. In the nextstage low-pass lter suppresses the aliasing components.

In practice, the low-pass lter should suf ciently attenua-te the stopband to suppress the unwanted images of the ba-seband. Finally the signal amplitude is increased R times tocompensate amplitude losses.

f L f H

Spectrum of q (t )

0.5 f c f c

|A|

f

1

Signal High

frequencycomponent

Analog low-passoutput filter

Fig. 6. Spectrum of click modulator output signal q(t) and analogoutput lter frequency responseRys. 6. Widmo amplitudowe sygna łu wyj ściowego dla modula-tora typu click modulation i charakterystyka cz ęstotliwo ściowaanalogowego ltru wyj ściowego

ADSP-21065L AD1819A

FPGA X3100E

Pulseamplifier

f (t ) f (nT s) q (kT s/8) q(t )

48 kHz 48 kHz 384 kHz 24 kHz200 MHz

Fig. 7. Block diagram of the digital audio ampli er

Rys. 7. Schemat blokowy cyfrowego wzmacniacza elektroaku-stycznego

The analog input signal is converted by 16-bit analog-to-digital converter (AD1819A) to digital form and transferred byserial port to ADSP-21065L.

The digital signal has a sampling rate f s = 48 kHz. The mainpart of the modulator is realized using oating point digital sig-nal processor ADSP-21065L with f clk=60 MHz clock frequency,delivering 60 million oating point instructions per second. Itis possible to calculate quantity of available processor ope-rations per input sample LDSP =f clk/f s=1250. The digital PWM isrealized with FPGA counters and it has a 13-bit resolution.The counters work with frequency f Mclk = 200 MHz. The swit-ching frequency of pulse ampli er transistors is f c = 24 kHz.The data to FPGA is fed with frequency f c = 24 kHz from theprocessor by serial port.

The block diagram for the digital realization of the click mo-dulator algorithm is presented in Fig. 10. Based on the linearphase response of the whole algorithm nite impulse response lters (FIR) have to be used. For Hilbert transformation of theinput signal a FIR lter is applied. A practical FIR implementa-tion of the Hilbert transformation will exhibit band-pass charac-teristics. The bottleneck of this algorithm is the low-frequencyperformance [6,9]. The Hilbert FIR lter was designed usingMatlab Signal Processing Toolbox, as shown in Listing 1 . Thefrequency response of the Hilbert FIR lter (red line) and de-

lay line (blue line) is depicted in Fig. 8 . Realization of ADSP-21065L code for such FIR lter is described in Listing 2 , withevery lter tap executed in a single processor machine cycle.Similar to the Hilbert lter is the design of the H a(z ) FIR lter.

Fig. 8. Frequency responses of the Hilbert FIR lter (red line) anddelay line (blue line): a) amplitude responses, b) difference ofphase responsesRys. 8. Charakterystyki cz ęstotliwo ściowe ltru typu FIR realizu-

ją cych transformat ę Hilberta (linia czerwona) i linii opó źniaj ą cej(linia niebieska): a) charakterystyki amplitudowe, b) charaktery-styki fazowe

0 0.5 1 1.5 2x 10

4

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

a)

0 0.5 1 1.5 2x 10

4

0

20

40

60

80

100

Frequency [Hz]

P h a s e

[ d e g

]

b)

Listing 1. Matlab program of interpolator FIR lter designLising 1. Program w Matlabie do projektowania ltru typu FIR

Listing 2. The ADSP-21065L code for FIR lter realizationListing 2. Program dla procesora typu ADSP-21065L realizuj ą cy ltrtypu FIR

N_H = 120; % OrderF = [0.02 0.98]; % Frequency Vector

A = [1 1]; % Amplitude VectorW = 1; % Weight Vectorb = remez(M, F, A, W, ’hilbert’) ;

/* load sample from circular buffer in data memoryand coefficient from circular buffer in program memory */f2 = dm(i0, m0), f4 = pm(i8, m8);/* loop initialization */lcntr = TAPS1−1, do (pc, 1) until lce;/* calculate filter tap */f8 = f2 * f4 , f12 = f8+f12 , f2 = dm(i0, m0), f4 = pm(i8, m8);/* calculate last tap */f8 = f2 * f4 , f12 = f8+f12;/* last accumulation */f12 = f8+f12;

Fig. 9. Block diagram of signal interpolator Rys. 9. Schemat blokowy interpolatora

x R H ( z )

R

x(nT ) x(kT/R)

y(kT/R)

f s Rf s Rf s

Page 89: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 89/156

ELEKTRONIKA 3/2010 87

In the designed modulator the nite impulse response lterFIR has to be used according to its linear phase response.

The chosen interpolator ratio is R = 8. The FIR

lter was de-signed using Matlab Signal Processing Toolbox as shown inListing 3 . The lter order is N int = 127.

The output signal spectrum and the lter frequency responseis presented in Fig. 11b . The designed interpolator requires

Lint = N int·R multiplication and addition per one input sample. Itis possible to decrease the quantity of arithmetic calculationby elimination of the multiplication and addition for zero va-lue samples. The block diagram of such solution is shown inFig. 12 [8]. This is a FIR based signal interpolator for R = 8 withperiodically switched coef cients and lter order N int = 127. Inthis case the interpolator requires Lint = N int multiplication andaddition per one input signal sample.

The modulator signal q(kT s/R ) has a sampling rate equalto 384 kHz. This time resolution is too low to perform highquality audio signal. Therefore zero crossing point has to becalculated with higher accuracy. The FPGA counters workwith a clock frequency equal to 200 MHz. The zero crossingpoint is calculated using linear interpolation [5]. This processis shown in Fig. 13 .

Experimental results

The ef ciency of the processor used for the realization of themodulator is not suf cient to support the entire algorithm at fullspeed (48 kHz), therefore signal band is limited to 12 kHz andtransistor switching frequency is 24 kHz. The click modulatoris a big challenge for the processor, for example, Streitenber-ger et al. [8] used three processors with computational power233 MMACs and two FPGAs.

Fig. 10. Block diagram of digital realization of click modulator algorithmRys. 10. Schemat blokowy cyfrowej realizacji modulatora typu click modulation

+ AEM

x

x(nT s)

f (nT s)

^f (nT s)

f (nT s)

H a( z ) FIR

H a( z ) FIR x

y(nT s)

xf (nT s)

yf (nT s)

s(nT s)

q(t )

cos(2π f cnT s)

sin(2π f cnT s)

H H( z ) FIR

0.5 N HT

f s = 48 kHz 48 kHz Rf s = 384 kHz

H int ( z )

FIR

s(kT s/ R)

Zero pointcalculation

D /t

Digital signal processor ADSP21065L FPGASpartan 3

XC3100 E

200 MHz 24 kHz

x

R

Fig. 11. Spectrums of the signals in the interpolator for R = 8 and12 kHz input sinusoidal signal: a) spectrum of expanded signal,b) frequency response of the FIR lter and spectrum of outputsignalRys. 11. Widma amplitudowe sygna łów interpolatora dla R =8i sygna łu sinusoidalnego o cz ęstotliwo ści 12 kHz: a) widmo syg-na łu po ekspansji, b) charakterystyka cz ęstotliwo ściowa ltruinterpolatora i widmo sygna łu po ltracji

Listing 3. Matlab program of interpolator FIR lter designListing 3. Program w Matlabie do projektowania ltru typu FIR dlainterpolatora

fp =48000*8;N = 127−1; % filter order Fpass = 12000; % passband FrequencyFstop = 30000; % stopband FrequencyWpass = 1; % passband WeightWstop = 1; % stopband Weightb = firls(N, [0 Fpass Fstop fp/2]/(fp/2), [1 1 0 0], [Wpass

Wstop]);

0 2 4 6 8 10 12 14 16 18x 10 4

-200

-150

-100

-50

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

a)

0 2 4 6 8 10 12 14 16 18x 10

4

-200

-150

-100

-50

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

b)

The spectrums of interpolator signals using such a FIR lter for 12 kHz sinusoidal input signal is shown in Fig. 11. The spectrum of the expanded signal is depicted in Fig. 11a .

Y ( z )

z -1

f s=48 kHz

z -1 z -1 X ( z ) R=8

h(0)h(1)h(2)h(3)h(4)h(5)h(6)h(7)

h(9)h(10)h(11)h(12)h(13)h(14)h(15)h(16)

h(17)h(18)h(19)h(20)h(21)h(22)h(23)h(24)

h(120)h(121)h(122)h(123)h(124)h(125)h(126)h(127)

Rf s=384kHz1 2 3 16...

Fig. 12. Block diagram of FIR based signal interpolator for R =8with periodically switched coef cients and lter order N int = 127Rys. 12. Schemat blokowy interpolatora dla R =8 opartego na l-trze typu FIR z okresowo prze łą czanymi wspó łczynnikami, rz ą d ltru N int = 127

Page 90: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 90/156

ELEKTRONIKA 3/201088

Fig. 13. Zero crossing calculationRys. 13. Wyznaczanie przej ścia przez zero

),( 00 y x

),( 11 y x

2 x

)2sin( c f

)( 2T n s

MHz 2001

kHz 241

kHz 241

MHz n

2001

kHz 4881

)(kT q

The click modulator circuit with pulse ampli er is shownin Fig. 14 , and was tested in our Institute laboratory. A blockdiagram of the test circuit is presented in Fig. 15 . Measu-rements were made using the computer controlled systemClio from Audiomatica. According to its advanced signalprocessing methods, it is possible to measure many elec-troacoustic parameters. Unfortunately this author has onlyaccess to the oldest version of such system with an 18-bitanalog-to-digital converter and a sampling rate of 48 kHz. Ithas too small a sampling rate to fully analyze such an am-pli er, having a measuring band limited to 24 kHz. Howeverit is possible to analyze the modulator limited to the 12 kHzband.

Experimental results for the sinusoidal input signal arepresented in Fig. 16 . The spectrum of the output signal foran input signal of 5 kHz is shown in Fig. 16a . Modulationcomponents are from a signal band of 300 Hz to 12 kHz, andsome harmonics in the signal band are connected with limi-ted time resolution. Similar results are obtained for an inputsignal frequency equal 1 kHz ( Fig. 16b ). Frequency respon-ses are shown in Fig. 17. The rst one is made using step-ped sinusoidal signal ( Fig. 17a ) and the second one usingmultitone sinusoidal signal ( Fig. 17b ). In both case resultsare similar.

Fig. 15. The testing circuitRys. 15. Schemat uk ładu pomiarowego

Fig. 14. The click modulator with pulse ampli er Rys. 14. Widok modulatora typu click modulation i wzmacniaczaimpulsowego

Fig. 16. Experimental results of digital audio ampli er output sig-

nal for f c = 24 kHz and sinusoidal input signal: a) f = 5 kHz, b)f = 1 kHzRys. 16. Wyniki eksperymentalne, widmo amplitudowe dla syg-na łu wyj ściowego wzmacniacza dla f c = 24 kHz i sinusoidalnychsygna łów wej ściowych: a) f = 5 kHz, b) f = 1 kHz

Fig. 17. Experimental results of click modulator, spectrums forf c = 24 kHz: a) frequency response for stepped sinusoidal input

signal, b) response for multitone sinusoidal input signalRys. 17. Wyniki eksperymentalne, charakterystyki cz ęstotliwo ś -ciowe wzmacniacza: a) odpowied ź cz ęstotliwo ściowa na sygna ł sinusoidalny typu sweep , b) odpowied ź cz ęstotliwo ściowa nasygna ł wielotonowy

ADSP 21065LEZ-LAB

BASYSXC3100E

FPGACLIO

PC

Analog testing signal

RS232

USB

PCI Bus

0 0.5 1 1.5 2x 10 4

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

a)

0 0.5 1 1.5 2x 10

4

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

b)

0 0.5 1 1.5 2x 10 4

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

a)

0 0.5 1 1.5 2x 10 4

-80

-60

-40

-20

0

Frequency [Hz]

M a g n

i t u d e

[ d B ]

b)

Page 91: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 91/156

ELEKTRONIKA 3/2010 89

Proposed new circuit

The whole algorithm is written in ADSP-21065L code whichis very similar to C language, therefore it is easy to move itto another processor. The digital signal processor and mic-rocontroller market is still growing and now there is availablea new microcontroller TMS320C28346 from Texas Instru-ments. It is more suitable for an such application than the old

ADSP21065L.

The TMS320C28346 Del no™ microcontroller devicesbuild on TI’s existing F2833x high-performance oating-pointmicrocontrollers. The C28346 delivers up to 300 MHz of oa-ting-point performance, up to 516 KB of single-access RAM,and PWM modules with 65 ps of resolution.

The on-chip peripherals and low-latency core make theC28346 an excellent solution for performance-hungry real-time control applications [11]. To increase the speed of thedevelopment process a C28346 DIM168 Experimenter’s Kit[12] and JTAG emulator USB2000 Controller will be used infuture research ( Fig. 18 ).

Fig. 18. The TMS320C28346 experimenter’s kitRys. 18. Zestaw uruchomieniowy z procesorem typuTMS320C28346

Fig. 19. Block diagram of proposed circuitRys. 19. Schemat blokowy proponowanego uk ładu

Serial port Pulse

amplifier

Digtalaudio

signal q(kT s) I 2S DAI

DIX4192

TMS320C28346

Processor corre HRPWM

Conclusion

The main advantage of click modulation are low switching fre-quency close to the upper signal band limit and high ef ciencyof energy conversion.

The main disadvantage of click modulation is complica-tion of the control algorithm. It is a big challenge even for thefastest digital signal processors. Another dif cult problem isoutput pulse time resolution. Fortunately the speed of modern

digital signal processors and microcontrollers is continuous-ly growing. The designed modulator cannot cover the wholeaudio band (20 Hz…20 kHz); the modulator achieves onlya band from 300 Hz to 12 kHz.

In the author’s opinion the new Del no™ oating pointmicrocontroller TMS320C28346 is suitable for the realizationof this algorithm for the whole audio signal frequency range(20 Hz…20 kHz).

References [1] Goldberg J. M. and Sandler M. B.: New high accuracy pulse

width modulation based digital-to-analogue convertor/power am-plier. IEE Proceedings Circuits Devices Systems, 141(4), 1994.pp: 315-324.

[2] Holmes G. D. and Lipo T. A.: Pulse width modulation for Powerconverters: principles and practice. Institute of Electrical andElectronics Engineers, Inc., 2003.

[3] Logan B. F.: Click modulation. AT&T Bell Laboratories TechnicalJournal, 63(3), March 1984, pages: 401-423.

[4] Kostrzewa M. and Kulka Z.: Time-domain performance investiga-tion of the click modulation-based PWM for digital class-D audiopower ampli ers, Signal Processing’2005, Workshop Proceed-ings, Poznan 30th September 2005, pp. 121-126.

[5] Kuncewicz Ł.: Design and Realization of PWM with click Modu-lation Algorithm, Master Thesis, University of Zielona Góra, Po-land, 2009, (in polish).

[6] Oliva A. i in.: A new audio le format for low-cost, high- delity, port-able digital audio ampli ers. Texas Instruments, October 2005.

[7] Soza ński K. i in., Digital Control Circuit for Class-D Audio Power Ampli er. Power Electronics Specialists Conference, PESC’2001,

Vancouver, 2001. [8] Soza ński K.: Design and Research of Digital Filters Banks UsingDigital Signal Processors. PHD Thesis, Technical University ofPozna ń, Pozna ń, Poland, 1999, (in polish).

[9] Streitenberger M. i in.: Class-D audio ampli ers with separatedbaseband for low-power mobile applications. ICCSC’02 – IEEE,June 2002, pp. 186-189.

[10] Verona J.: Power digital-to-analog conversion using sigma-delta andpulse width modulations. ECE1371, Analog Electronics II, 2001.

[11] TMS320C28346, TMS320C28345, TMS320C28344TMS320C28343, TMS320C28342, TMS320C28341 Del no Mi-crocontrollers, Data Sheet, Texas Instruments, Literature Number:SPRS516, March 2009.

[12] TMS320C2000 DIM168 Experimenter’s Kit Overview, QuickStart Guide, Texas Instruments, Literature Number: SPRUFT7,March 2009.

Block diagram of proposed circuit is presented in Fig. 19 .In this circuit time period is counted by high resolution pulsewidth modulation (HRPWM).

Page 92: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 92/156

ELEKTRONIKA 3/201090

Demand of fast, real time image processing and analysisrequires development of new hardware systems suitable toperform this task. In particular, image segmentation is animportant part of image processing, with a key in uence onquantitative results of its further analysis. There are manyimage segmentation methods including e.g. arti cial neuralnetworks. One of the recent approaches to this task is a ne-twork of synchronised oscillators. Its operation is based on

“temporary correlation” theory [1,4], which attempts to explainscene recognition as performed by a human brain. To imple-ment this theory, Wang [1] proposed an oscillator model toemulate brain neural cell and network of connected oscillatorsfor image segmentation.

This model is also very suitable for hardware realization,which speeds up the image segmentation. Such a networkwas already manufactured as an ASIC CMOS VLSI chip [2, 3].It contains a matrix of active image processing elements with8x8 and 32x32 sizes. However, the analogue realization suf-fers of many drawbacks due to differences between networkoscillators caused by the scattering of transistors channellength. This leads to the signi cant changes of oscillators’output characteristics. Another problem is a complex designprocess and small matrix size which limits the practical appli-cations of the network circuit.

To overcome these problems, the digital network architec-ture has been proposed [5]. It allows the implementation oflarger processing matrix. Also, the same active element cha-racteristics are obtained since each network node representsthe same digital circuit. For implementation of the digital imageprocessor the Virtex-5 FPGAs by XILINX [6] was considered.

Proposed digital network is part of image processing sys-tem, as shown in Fig.1 . It consists of a host computer that isboth a source of image data and image analysis client, TCP/IPbased network link and image processor.

Architecture of image analysis systemfor implementing parallel digital image processor

(Architektura systemu analizy obrazów implementujacegorównoleg ły cyfrowy procesor obrazowy)

mgr PRZEMYS ŁAW BRYLSKI, dr hab. MICHA Ł STRZELECKITechnical University of Lodz, Institute of Electronics

This paper presents architecture and a new algorithm de-veloped for digital image processor. Section 2 describes digitalnetwork architecture, its operation, simulation and synthesis re-sults. Section 3 presents a new block diagram of digital imageprocessor; modi ed algorithm designed for the FPGA resourcesreduction and explains the reason behind choosing the particularmicrocontroller. Finally, section 4 summarizes the advantages ofthe new architecture in comparison to the previous processor

implementation.

An image processor

The parallel image processor proposed in [5] implements thematrix of active nodes which correspond to the image pixels.These nodes are connected by weights, which depend on graylevels of neighboring pixels. To simplify the network structureand to save hardware resources, weight values between nodesare calculated based on pixel intensities and stored before seg-mentation. In the digital version of the network, node labelingsubstitutes oscillations to obtain segmentation results. Nodeswhich belong to the homogeneous image region possess thesame unique label that is assigned to them during iterative ne-twork operation. During each clock cycle, the label is assignedto all these neighbors of given active node (which already hasbeen labeled), for which connection weight is suf ciently high.

Proposed image processor has been implemented in VHDL[7,8] language and simulated in ModelSim software for 8x8nodes and neighborhood size N = 4. Results of these simula-tions were presented in [5]. It has been demonstrated that thenetwork of labeled nodes can be applied for image segmenta-tion. Sample binary image (shown in Fig. 2 ) with three objects(white pixels) on background (black pixels) was used for networktesting. Fig. 3 presents segmentation result. As can be seen, thenetwork can distinguish three homogeneous areas in the ana-lysed image. Pixels belonging to these areas were marked bydistinct labels “1”, “2” and “3” respectively.

Fig. 1. Block diagram of the image processing systemRys. 1. Schemat blokowy systemu przetwarzania obrazu

Internet Client Imageprocessor

The usage of TCP/IP protocol as communication channelallows user to place the data source and the image proces-sor at any remote location and connect both elements by the

Internet. This con guration separates data source from clientmaking presented system more exible. Moreover multicasttransmission of processing results is possible to multiple cli-ents.

Fig. 2. Sample binary imageRys. 2. Przyk ładowy obraz binarny

Page 93: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 93/156

ELEKTRONIKA 3/2010 91

Background of the image was not labeled (the initial la-bels values equal to 0 were maintained). Background nodes(corresponding to pixels with zero value) are always disabledbecause their weights are equal to zero. Then, such nodescan not be activated and remain disabled [5].

In hardware implementation of an image processing systemto carry out tasks of microcontroller the EM2440-III [9] develop-ment platform was chosen. The EM2440-III is an ARM-9 basedboard, populated with the S3C2440A (up to 400 MHz, 256 MBNAND Flash, 64 MB SDRAM) microcontroller. Rich peripher-als such as USB, Ethernet, SPI make this dev kit suitable ourapplication.

The present on-board MMU (Memory Management Unit)allows the use of an operating system. We chose Embedded

Linux, because it is a exible, reliable operating system withvery little memory needs. Linux provides a rich programmingenvironment with support for many devices and network pro-tocols including TCP/IP stack. The last listed functionality isextremely useful in our application because we plan to imple-ment the exchange of data with a PC client based on a TCP/IPsockets.

The only drawback resulting from the use of Linux is theneed to write a SPI device driver for communication with con-trol unit.

The objective of the control unit (CU) is downloading thepreprocessed image data from the microcontroller into pro-cessing matrix, detecting the end of segmentation process and

delivering the analyzed image back to the microcontroller.

Fig. 3. Segmentation result of the image from Fig. 2Rys. 3. Wynik segmentacji obrazu z rysunku 2

0 0 0 0 0 0 0 0

0 0 0 0 1 1 0 02 2 0 0 1 1 1 0

2 2 2 0 1 1 1 0

2 2 0 0 0 1 0 0

0 0 0 0 0 1 0 0

0 0 0 0 0 0 0 0

0 3 3 3 3 3 3 0

Image processor described in [5] has been synthesizedand then placed and routed for XC3S1600E with Xilinx ISE8.2. The implemented design utilizes approximately 93% slic-es of the XC3S1600E FPGA (20% of slices for ip ops, 87%of slices for 4 input LUTs).

Modi cations of image processing system

This section presents modi cations of the architectureand algorithm of image processor as well as justi cationfor selection of a particular microcontroller is also presen-ted in this section. Proposed modi cations lead to the re-duction of the FPGA resources allocated for a single pro-cessing unit (pixel) and increase functionality of the entiresystem.

A block diagram of new image processor structure ispresented in Fig. 4. It contains microcontroller, control unitand a matrix of NxN nodes, which represent image pixel pro-cessing units. Microcontroller performs the following opera-tions:• program the FPGA con guration• load the image from the host computer • evaluation of node weights and activation tables• control of the segmentation process• delivery the processed image to the host computer

Fig. 4. Block diagram of image processor Rys. 4. Schemat blokowy procesora obrazu

Ethernet SPI

FPGAconfiguration

ROM

Microcontroller

ControlUnit

MatrixNxN Nodes

FPGA

Fig. 5. A single network nodeRys. 5. Pojedynczy w ęze ł sieci

LIN i,k-1

Node ikAIN i.k-1

A IN i,k+1

LIN i-1,k

AIN i+1,k

AIN i-1,k

L IN i+1,k

L IN i,k+1

R

F/CBUS

clk

AOUT i,k LOUT i,k

Fig. 5 shows a single network node. The meaning of nodesignals is as follows:• AIN ik – input signals representing the activity of (i,k) node

neighbors,• AOUT ik – node activation output signal,• LIN ik – n-bit label of (i,k) node neighbors,• LOUT ik – n-bit output signal of (i,k) node label after its activa-

tion,• R – synchronous reset input,• F/C BUS – two bi-directional control and data interfaces,• clk – clock signal.Modi cations listed below allow the analysis of larger images

by reducing the complexity of the single network node rep-resenting a single image pixel. It is achieved by:

• Computation of node weights by the microcontroller. Itmakes possible the implementation of more complexweights formulas (needed e.g. for image texture segmen-tation) with the use of larger number of image features.

Page 94: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 94/156

ELEKTRONIKA 3/201092

• Activation table orders neighbor nodes accordingly to theweight values which connect these nodes to the processednode. This information is important during node activation;each node receives the label from its active neighbor rep-resenting the largest weight connection. The activation ta-ble is evaluated for each node by microcontroller and thenstored in the F register. This table is presented in Fig. 6 .

Fig. 6. Idea of the activation table for neighborhood size N=4Rys. 6. Koncepcja tabeli aktywacji dla s ą siedztwa o rozmiarzeN = 4

Activationcheck block

ActivationTable4x2 bits

&Modulo-4counter

0

1MUX

2Sel

3PA bit

AIN(0)

AIN(3)

AIN(2)

AIN(1)

Fig. 7. Single node communication interfaceRys. 7. Interfejs komunikacyjny pojedynczego w ęzła

Another bene t of the proposed solution is the ability oftransferring different commands to all nodes in the same timeinstant. This is possible thanks to cascade connection of acti-ve matrix elements. Data and commands are transferred to(i,k) node by shifting via all nodes in the chain. This allowsto output the segmentation result from the matrix during thetransfer of commands to nodes. As can be seen from Table1, each node supports three commands that are coded by thestate of RE line and its command register – IS bit:

o “NOP” – no operation performedo “Load Label” – activation status and label assignment tothe leader node

o “Read Label & PL” – read the node label during segmenta-tion process and the state of its PL bit

E.g. if the activation table contains the following values:a_tab[]={1,1,2,2}; (for N = 4) then the given node checks sta-tus of its neighbours indexed by 1 or 2 and can only be activa-ted from these nodes. This solution considerably reduces thenumber of ip-ops necessary to store the information aboutnode’s neighbourhood.• Replacement of the parallel IO_BUS interface (the routing

to all nodes requires 11 global lines) by two Serial Perip-heral Interfaces (SPI), as shown in Fig. 6 . These interfacesare used to write data into F and C registers.F register is used for loading the activation table, while C

register contains commands sent to the node.The meaning of the F register bits is as follows:

o PA – potential activity bit, if set node performs normal ope-ration, otherwise it remains always disabled

o PL – potential leader bit – if set, indicates that node waspotential leader at the start of the segmentation

o N3 ÷ N0 – contain the activation table assigned to thenode

The meaning of the C register bits is as follows:o IS – instruction set as described in Table 1o PL – indicates if the node is still a potential leader o Label – contains the signature stored in the node

These interfaces use only 4 global lines:o F_SCK – F register bus clock for data communication and

synchronizationo EXEC – the node execution command trigger. When acti-

ve, the node analyses command latched in its shift regi-ster

o RE – triggers the reading of segmentation results from no-des

o C_SCK – bus clock for data communication and synchro-nization during commands transfer

Also, 4 locally connected lines are employed (what is inexpen-sive in FPGA devices):

o F_SDI – serial data input for F register o F_SDO – serial data output for F register o C_SDI – serial data input for C register o C_SDO – serial data output for C register

Tabl. 1. List of commands supported by a single nodeTab.1. Lista komend obs ługiwanych przez pojedynczy w ęze ł

RE IS Action

0 0 NOP

0 1 Load Label

1 X Read Label & PL

A digital image processor performs the following segmen-tation algorithm:Step 11. Image information is downloaded via the central unit input

bus into processing matrix.2. Node initialization – Reset signal is activated.3. The activation table is transferred to nodes.Weights between each node neighbors are computed by theexternal processor using the formula:

(1)

where i,k are node coordinates, NoN is the number of all neighborsconnected to each node, I ik represents pixel value in image point(i,k), I n is the intensity of the n-th neighbor pixel of node ( i,k ).

The image segmentation was began

Step 2

4. Nodes activity bits A OUT ik are disabled.5. Microcontroller selects one of leader nodes and assigns to

him the unique label. Activity bit of this node is set, while itsPL bit is reset (to be no more selected as the leader).

NoN n

otherwise

I I if W nik

nik ,..,1,0

255255, =

===

Page 95: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 95/156

ELEKTRONIKA 3/2010 93

6. Central unit (CU) generates clk signal.7. Segmentation takes place until after subsequent clk signal

there is no label change in any node. This completes recognition of the single object.8. Microcontroller performs operation starting from p. 4 until

there are no more leaders (PL bits of all nodes are re-set).

The segmentation is nished

Step 39. Labels L ik of all nodes are transferred to CU via F/CBUS.

10. The labeled image is uploaded to the microcontroller usingthe output bus.

A single node of image processor performs the followingalgorithm.

After the Reset signal from CU, all network nodes are notactive. Then each node performs the following operations, af-ter rising edge of clk signal:1. If node is not active (A OUT ik bit is reset), the status of its nei-

ghbors is checked in order de ned by the activation table,according the formula:

(2)

where: H is a Heaviside function (equal to 1 if its argumentis greater than zero, and zero otherwise). AL is the activationlevel, if AL > 0 then node ( i,k ) assumes a label from its activeneighbor.2. Finally, if AL > 0, node changes its status to the active one

(AOUT ik bit is set) and sets its output label signal L OUT ik .

Conclusion

A new proposed digital image analysis system has beenpresented and described in this paper. It has the followingadvantages when compared to the architecture presented in[5]:• reliable, ef cient communication interface based on TCP/

IP sockets, compatible with most operating systems;• possibility of processing larger images in the same FPGA

device thanks to reduction of FPGA logic resources alloca-ted for a single node;

• implementation of more complex weights formulas withincreased number of image features. This is especiallyimportant when complex (e.g. textured or multimodal) ima-ges are segmented;

( )[ ]( )∑=

−= NoN

n IN ntaba A H AL

1

1 _

• application of different image processing functions, likeedge detection or morphological ltering by easy adapta-tion of the network weights de nition.

These new features of the digital image processor were achie-ved thanks to modi cations of the system structure:

• application of the external microcontroller for computationof the node weights,

• usage of the Linux system functionality,• replacement the parallel IO_BUS interface by two SPI in-

terfaces to reduce utilization of global lines (from 11 to 4);to make use of build in FPGA shift registers instead of ip-ops (this reduces area utilization by the single node) andto transfer different commands to all nodes in the sametime,

• storage the nodes neighbourhood data in form of activa-tion table, this considerably reduces the FPGA resources.Proposed modi cations can in uence the speed of seg-

mentation, which can be relatively low when compared to theanalogue realization. The segmentation time depends on theoscillator characteristics only. In digital network this time de-pends on the number of clock cycles needed for image objectanalysis. Thus, image size, number of objects and even object

shape will strongly in

uence segmentation duration.Further works will focus on speeding up the segmentationprocess by developing a more effective method of leader no-des selection and further parallelization of the image analysis.

References

[1] Çesmeli E., Wang D.: Texture Segmentation Using Gaussian-Markov Random Fields and Neural Oscillator Networks. IEEETransactions on Neural Networks, 12, 2, 2001, pp. 394-404.

[2] Kowalski, J., Strzelecki M., Majewski P.: CMOS VLSI Chip ofNetwork Of Synchronised Oscillators: Functional Tests Results.Proc. of IEEE Workshop on Signal Processing 2006, Poznan,Poland, pp. 71-76.

[3] Strzelecki M., Kowalski J., Majewski P., Kim H.: SynchronizedOscillator Network ASIC CMOS Chip for Segmentation of Binary

Images. Proc. of the 6 th International Workshop on MultimediaSignal Processing & Transmission, 20.11.06, Chonbuk NationalUniversity, Jeonju, Korea, pp. 113-122.

[4] Wang D., Ternan D.: Image segmentation based on oscillatorycorrelation. Neural Computation, 9, 1997, pp. 805-836.

[5] Brylski P., Strzelecki M.: Digital network of labelled nodes forimage processing. Elektronika – konstrukcje, technologie, zas-tosowania, 3, 2009, pp. 46-50.

[6] http://www.xilinx.com/products/virtex5/index.htm last visited inMay 2009.

[7] Skahill K.: VHDL for Programmable Logic. Addison-Wesley1996.

[8] Pedroni Volnei A.: Circuit Design with VHDL. MIT Press 2004.[9] http://www.armdesigner.com/EM2440-III.html last visited in De-

cember 2009.

Page 96: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 96/156

ELEKTRONIKA 3/201094

Rozpoznawanie i identy kacja mówcy, szczególnie na pod-stawie rozmów telefonicznych wymaga ulepszania realizuj ą -cych je algorytmów. Celem poprawy sprawno ś ci rozpoznania,celowe jest zastosowanie dedykowanych próbek g łosu w za-leżno ś ci od stosowanych kodeków (np. telefonii komórkowejlub stacjonarnej). Wynika st ą d konieczno ść detekcji kodekówmowy. G łówn ą ide ą detekcji kodeka jest obserwacja, że syg-

na ł powtórnie poddany kompresji stratnej tym samym algoryt-mem nie ulega du żym zmianom. Zatem poprzez zakodowaniei zdekodowanie badanego sygna łu i porównanie wyniku z syg-na łem wej ś ciowym mo żna oceni ć , czy sygna ł by ł wcze ś niejkompresowany badanym kodekiem. W przypadku sygna łu,który nie by ł przetworzony danym kodekiem, uzyskany b łą dmię dzy obydwoma sygna łami jest wi ę kszy ni ż w przypadkuprzeciwnym. Jednak bezpo ś rednie wykorzystanie np. b łęduś redniokwadratowego mi ę dzy sygna łami wej ś ciowym, a pod-danym kodowaniu stratnemu nie jest miarodajn ą technik ą de-tekcji kodeka ze wzgl ę du na zbyt ma łe wzajemne rozsuni ę ciehistogramów rozk ładu b łędów. Zmiana reprezentacji sygna łumowy na skal ę melow ą w du żym stopniu wp ływa na popraw ę wyników [1].

Implementacja w ś rodowisku Matlab

Na rysunku 1. przedstawiono zaproponowany algorytm de-tekcji kodowania GSM o pe łnej szybko ś ci. Istotnym etapemprac jest implementacja kodeka GSM [2]. Bloki kodera orazdekodera pe łnej szybko ś ci s ą przedstawione schematyczniena rys. 2.

Procedury realizuj ą ce przetwarzanie wst ę pne (preproces-sing) sygna łu, analiz ę LPC oraz analiz ę krótkookresow ą s ą wywo ływane raz na ka żdą ramk ę sygna łu mowy sk ładaj ą cą się ze 160 próbek. Z kolei predykcja d ługookresowa oraz kodowa-nie RPE s ą wykonywane czterokrotnie w ramce ze wzgl ę du nadodatkowy podzia ł na 40-to elementowe podramki.

Wp ływ segmentacji sygna łuw procesie detekcji kodowania GSM

mgr in ż. RADOS ŁAW WEYCHAN, dr in ż. TOMASZ MARCINIAK,prof. dr hab. in ż. ADAM D Ą BROWSKI

Politechnika Pozna ńska, Katedra Sterowania i In żynierii Systemów,Pracownia Przetwarzania Sygna łów i Uk ładów Elektronicznych

Rys. 1. Schemat blokowy algorytmu detekcji kodowania GSMw sygnale mowyFig. 1. Block diagram of GSM coding detection algorithm in spe-ech signal

Rys. 2. Schematy blokowe kodera i dekodera GSM o pe łnej szyb-ko ś ciFig. 2. Block diagrams of full rate GSM encoder and decoder

W ś rodowisku Matlab sygna ł jest wczytywany do bufo-ra przy pomocy funkcji waveread [7]. Nast ę pnie w p ę tli s ą przetwarzane kolejne 160-cio elementowe ramki, które pozakodowaniu s ą od razu przesy łane do dekodera. Zbiór prze-tworzonych oraz nieprzetworzonych sekwencji zapisanychw dodatkowym buforze, którego wielko ść jest przedmiotembada ń opisanych w artykule, jest nast ę pnie przekszta łcany

do skali melowej. Dla uzyskanych w ten sposób ci ą gów jestbadany b łą d ś redniokwadratowy mi ę dzy nimi.

Algorytm detekcji kodowania GSM, przedstawiony, na rys. 1,zaimplementowany zosta ł w dwóch wersjach – jako zestaw sa-modzielnych plików funkcyjnych z rozszerzeniem * .m oraz w do-datkowym pakiecie Simulink. Ze wzgl ędu na du żo większ ą przej-rzysto ść na rys. 3 zaprezentowano schemat blokowy algorytmuzrealizowanego w pakiecie Simulink. Niewykorzystane w sche-macie wyprowadzenia s łużą do implementacji innych algoryt-mów decyzyjnych oraz innego sposobu prezentacji wyników.

Cel segmentacji i jej wp ływ na detekcj ęOkresowa detekcja kodowania GSM przy pe łnej szybko-

ś ci jest podyktowana konieczno ś cią realizacji nast ę puj ą cychwarunków:• informacja o przyporz ą dkowaniu zostaje przes łana w sko ń-

czonym, mo ż liwie krótkim czasie, co w przypadku d ługichsekwencji jest nierealizowalne,

• implementacja sprz ę towa algorytmu powinna zajmowa ć mo ż liwie ma ło zasobów systemowych,

• w przypadku sprz ęż enia ś rodowisk Matlab oraz Code

Composer Studio przez pakiet Link for CCS nie jest mo ż-liwa dynamiczna alokacja pami ę ci, której celem jest opty-malizacja jej zu życia oraz przetwarzanie sygna łów o ró ż-nych, nie zadeklarowanych czasach trwania.

Page 97: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 97/156

ELEKTRONIKA 3/2010 95

do przypadku sygna łów nieprzetworzonych, gdzie kluczoweznaczenie mia ły warto ści minimalne b łędów, tak w tym przy-padku brane s ą pod uwag ę warto ści maksymalne.

Rysunek 5 potwierdza w tym przypadku tendencj ę dozmniejszania si ę b łędu wraz ze zwi ększaniem si ę liczby te-stowanych ramek.

Rys. 3. Schemat blokowy algorytmu zrealizowanego w pakiecieSimulink

Fig. 3. Block diagram of algorithm realized in Simulink

Okresowa detekcja odbywa si ę zgodnie z nast ępują cymalgorytmem:• kopiowanie 160-próbkowych ramek sygna łu testowanego

do osobnej tablicy b ędą cej wielokrotno ścią liczby 160• kopiowanie analogicznych 160-próbkowych ramek sygna-

łu otrzymanego w wyniku kodowania i dekodowania ko-derem pe łnej szybko ści do osobnej tablicy o tym samymrozmiarze co w poprzednim punkcie

• transformacja obu sygna łów do skali melowej• obliczanie b łędu średniokwadratowego mi ędzy obydwoma

sygna łami.Porównywanie wp ływu okresowego badania b łędu śred-

niokwadratowego odbywa si ę dla pakietów 25, 50 oraz 100ramek, co odpowiada detekcji co 0,5; 1 i 2 sekundy. Wyko-rzystane zosta ły wybrane próbki sygna łów mowy o czasietrwanie od oko ło 2 sekund do oko ło 3 minut [5], o ró żnychpoziomach g łośno ści, nagrane z szybko ścią próbkowania8000 próbek na sekund ę i rozdzielczo ścią 16 bitów. Rysunek4 przedstawia rezultaty bada ń detekcji dla sygna łów nieprze-tworzonych algorytmem kodowania GSM pe łnej szybko ści.Konieczne jest odnotowanie, i ż wzięte pod uwag ę zosta ły mi-nimalne warto ści uzyskanych b łędów średniokwadratowych,gdy ż to one maj ą bezpo średni wp ływ na ko ńcow ą warto ść progow ą . Dla sekwencji testowej numer 4 („sekw. 4”) nie zo-sta ł wyznaczony jeden wspó łczynnik ze wzgl ędu na zbyt krót-ki czas jej trwania (1,4 s).

Rysunek 4 pokazuje ogóln ą tendencj ę do zwi ększania si ę minimalnego b łędu średniokwadratowego wraz ze wzrostemliczby badanych ramek sygna łu mowy. Im wy ższy jest mini-malny próg, tym wi ększe jest prawdopodobie ństwo separacjiprzedzia łów dla sekwencji przetworzonych oraz nieprzetwo-rzonych.

Analizuj ą c skrajne warto ści b łędów nale ży mie ć na uwa-dze, i ż nie reprezentuj ą one wszystkich warto ści uzyskanychw testach. Dobór ich jako wyznacznika do dalszych testówma na celu zwi ększenie prawdopodobie ństwa odpowiedniejklasy kacji sygna łu. Przyk ładowe histogramy b łędów s ą po-

kazane w dalszej cz ęści.Kszta łtowanie si ę maksymalnych warto ści b łędów przy

kodowaniu sygna łu mowy koderem GSM sekwencji przetwo-rzonych przez koder stratny prezentuje rys. 5 . Analogicznie

Rys. 5. Wykresy maksymalnego b łędu ś redniokwadratowego dlaokresowej detekcji kodowania GSM pe łnej szybko ści w ka żdejz wcze śniej przetworzonych sekwencji testowychFig. 5. Graphs of maximum MSE for periodic GSM full rate detec-tion for processed test sequences

Rys. 4. Wykresy minimalnego b łędu ś redniokwadratowego dlaokresowej detekcji kodowania GSM pe łnej szybko ści w ka żdejz nieprzetworzonych sekwencji testowychFig. 4. Graphs of minimum MSE for periodic GSM full rate detec-tion for unprocessed test sequences

Page 98: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 98/156

ELEKTRONIKA 3/201096

Celem jak najdok ładniejszego wykrywania kodowaniaGSM pe łnej szybko ści w sygnale mowy zdecydowano si ę na okresowe badanie 100 ramek. Zatem testowany syg-na ł nie mo że by ć krótszy ni ż 2 sekundy. Przedzia ły detekcjiz uwzgl ędnieniem warto ści skrajnych przedstawia rys. 6.

Rys. 6. Przedzia ły b łędów dla sygna łów przetworzonych i nie-przetworzonych algorytmem kodowania pe łnej szybko ściFig. 6. MSE ranges for processed and unprocessed speech

Rys. 7. Przyk ładowy histogram b łędów ś redniokwadratowychdla sekwencji nr 12Fig. 7. Illustrative MSE histogram for test sequence number 12

Rys. 8. Uaktualnione przedzia ły warto ści b łędów dla sygna łówprzetworzonych i nieprzetworzonych algorytmem kodowaniape łnej szybko ściFig. 8. Updated MSE ranges for processed and unprocessed speech

Uzyskane na rys. 6 przedzia ły zawieraj ą znacz ą cą cz ęść wspóln ą , st ą d konieczno ść dok ładniejszej analizy uzyskanychwarto ści skrajnych zawieraj ą cych si ę we wspólnym przedzia-le. Przyk ładowy histogram b łędów średniokwadratowychw przedziale od 0 do 3 z rozdzielczo ścią 0,02 dla niekodowa-nej sekwencji nr 12 prezentuje rys. 7 .

Analiza histogramów dowodzi, i ż skrajne b łędy s ą odsepa-rowane od reszty warto ści, st ą d mo żna je uzna ć za niewp ły-wają ce w znaczny sposób na skuteczno ść detekcji. W celu

jednoznacznego okre ślenia przedzia łów wykrywania kodowa-nia pe łnej szybko ści, w sygnale mowy nie wzi ęto pod uwag ę skrajnych b łędów 8 sekwencji, co jest równoznaczne z odrzu-ceniem 8 ramek sygna łu mowy o d ługo ści 2 sekund.

Uaktualnione przedzia ły b łędów dla sekwencji przetworzo-nych oraz nieprzetworzonych prezentuje rys. 8 .

Warto ść progu decyzyjnego zosta ła ustalona po środkuprzedzia łu separuj ą cego, i wyznaczona zgodnie z rys. 8 jako1,5297.

Dla sekwencji trwaj ą cych powy żej 2 sekund jest wyzna-czana średnia z uzyskanych warto ści b łędów. Przedzia ły zo-sta ły zadeklarowane jako lewostronnie domkni ęte. Je śli war-tość b łędu średniokwadratowego zawiera si ę w przedziale od0 do 1,5297, sygna ł jest klasy kowany jako przesy łany przezsie ć GSM z kodowaniem pe łnej szybko ści, w przeciwnym wy-

padku sygna ł jest klasy kowany jako pochodz ą cy ze źród łaniekodowanego tym kodekiem.Sprawno ść detekcji kodowania GSM pe łnej szybko ści

z zastosowaniem segmentacji sygna łu mowy na 2-sekundo-we pakiety przedstawia tabela 1. Szczegó łowe zestawienieprocentowej poprawno ści detekcji próbek sygna łu mowy wy-krywanych z b łędami zawiera tabela 2.

Tab. 1. Efektywno ść detekcji kodowania GSM pe łnej szybko ściTabl. 1. Ef ciency of GSM full rate coding detection

Ca łkowita liczba 2-sekundowych pakietóww sekwencjach testowych 822

Liczba pakietów odrzuconych w procesiedoboru progów detekcji 8

Liczba pakietów poprawnie sklasy kowanych 814

Sprawno ść 99,03%

Tab. 2. Efektywno ść detekcji kodowania GSM pe łnej szybko ści z b łę-dami klasy kacji pakietów 2-sekundowychTabl. 2. Ef ciency of GSM full rate detection with wrongly detected2-seconds frames

Nazwa sygna łuwykrywanego

z b łędami

Liczba

pakietów2-sekundowychw sygnale

Liczbapakietów

odrzuconych% poprawno ścidetekcji

Sekw. 2 24 1 95,83%

Sekw. 6 32 2 93,75%

Sekw. 11 69 2 97,10%

Sekw. 12 85 3 96,47%

Dane z tabel 1 i 2 wykazuj ą du żą sprawno ść algorytmu.Nale ży zauwa żyć, że źle klasy kowane 2-sekundowe pakietynie wyst ępują bezpo średnio obok siebie. Numery kolejnych,niew ła ściwie sklasy kowanych sekwencji s ą zawarte w tabeli3. Pomini ęto w niej ście żkę „sekw. 12” ze wzgl ędu na poje-dynczy b łą d.

Tab. 3. Odst ępy czasowe mi ędzy kolejnymi b łędnie klasy kowanymipakietami 2-sekundowymiTabl. 3. Time distances between wrongly detected frames

Nazwa sygna łu wykrywanego z b łędami

Indeksy b łędniesklasy kowanych

pakietów

Odst ępy czasowe [s]

Sekw. 6 40, 62, 85 42, 44

Sekw. 11 42, 48 10

Sekw. 12 15, 17 2

Page 99: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 99/156

ELEKTRONIKA 3/2010 97

Podsumowanie

W artykule przedstawiono badania zwi ą zane z zaprojektowa-niem oprogramowania wykrywaj ą cego kodowanie GSM pe łnejszybko ści w sygnale mowy. Badania i symulacje przeprowa-dzono w środowisku Matlab. W tym celu dokonano analizy za-gadnie ń dotycz ą cych przetwarzania i transmisji sygna łu mowyw sieci GSM ze szczególnym uwzgl ędnieniem dokumentacjiopisuj ą cej koder oraz dekoder pe łnej szybko ści [2]. Na jej pod-

stawie opracowano oprogramowanie w środowisku Matlab/Si-mulink. Testy dzia łania opracowanego algorytmu dokonanoz uwzgl ędnieniem wielu czynników, takich jak porównanie wy-ników z zewn ętrznymi koderami oraz funkcjonowanie dla da-nych wej ściowych o ró żnym zakresie dynamicznym. Na drodzeeksperymentalnej ustalono 2-sekundow ą długo ść testowanegosegmentu i próg detekcji o warto ści 1,5297. Wysoka sprawno ść algorytmu potwierdza poprawno ść zarówno jego ogólnej kon-cepcji jak i wyznaczonych warto ści parametrów steruj ą cych.

Praca wspó ł nansowana z projektów PPBW i 93-72/10 BW.

Literatura

[1] Dą browski A., Drgas Sz., Marciniak T.: Detection of GSM speechcoding for telephone call classi cation and automatic speakerrecognition. ICES 2008, 415-418.

[2] GPP TS 06.10 V8.2.0 (2001-06), 3rd Generation PartnershipProject; Technical Speci cation Group Services and System As-pects; Digital cellular telecommunications system (Phase 2+);Full rate speech; Transcoding (Release 99).

[3] Ho łubowicz W., P łóciennik P.: GSM cyfrowy system telefoniikomórkowej. Pozna ń 1995.

[4] Weso łowski K.: Systemy telekomunikacji ruchomej. WKi Ł,Warszawa 2003.

[5] Weychan R.: Detekcja kodowania GSM w sygnale mowy.[6] MATLAB® 7 release 2009a, Getting Started Guide, 2009[7] Embedeed Matlab Help, 2009[8] Brookes M.: VOICEBOX: Speech Processing Toolbox for MAT-

LAB. http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html ,2002

Recently one observes a growing interest in applying ananalog technique to some unique signal processing tasks[2-17]. Advances in CMOS processes allow us to think reali-stically, among others, about building large neural networksin a chip form and learn them on silicon. Apart from classicalvoltage mode processing based on both digital and ana-log electronics, current mode analog technique is gainingpopularity lately. This is because it is well suited to be im-plemented within modern submicro- and nano-technologyintegrated circuits that operate with lower and lower supplyvoltages and consume smaller and smaller amount of po-wer. Hardware implemented neural networks based on theanalog technique offer a possibility of fast learning withina chip. Applying this technique one can reach a much lar-ger scale of parallel signal processing than it is achievablewhen using digital signal as well as voltage-mode analogsignal processing. The possibility of large-scale concurrentprocessing results directly from a low amount of power dis-sipated by each element in the parallel processing paths.The achievable very large scale of parallel processing mayensure fast system functioning even if processing elementsincluded in the parallel working paths within a chip are notnecessary very fast.

Furthermore, the current-mode technique is attractive in

arithmetic calculations as operations like adding and multip-lying can be carried out extremely fast. This is because boththe summation (currents are added in one node) and the mul-tiplication (Gilbert multiplier) do not need any clock circuitry

like it is the case in logic gates (digital electronics). Althoughprecision of analog calculations is typically not very high, theobtained extremely high speed allows us to compensate forlow precision by implementing on chip fast adapting systemsto change the calculation results.

In this paper, advantages and restrictions of analog current-mode signal processing are discussed. Next, chosen analogcircuits suitable to be used for hardware implementation ofneural networks of a self-organizing type are presented. Ne-tworks of this type, called Kohonen’s networks, are especiallywell suited to be implemented in a chip form with the analogtechnique use [6, 12-17].

Apart from theoretical considerations, some SPICE simu-lation results for a 0.35 um CMOS process are presented.Moreover, layout of a novel fully integrated Kohonen networkprototyped by means of a 0.18 um CMOS process is alsoshown.

Voltage-mode versus current-mode circuitoperationModel an electronic circuit as shown in Fig. 1 . V T in Fig. 1 is an ideal voltage source representing some driving source,Z T some self-impedance of the driver plus impedance repre-

senting conducting path connecting the source with its load,and Z L a loading impedance. In this model, voltage across theload, V L, and current owing from the source to the load, I , canbe expressed as:

Analog signal processing suited for neural-networkhardware implementation

(Analogowe przetwarzanie sygna łów odpowiedniedo sprz ętowej implementacji sieci neuronowych)

dr hab. in ż. RYSZARD WOJTYNA, prof. UTP

University of Technology and Life Sciences, The Academy of Information Technology

Page 100: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 100/156

ELEKTRONIKA 3/201098

(1)

(2)

LT

LT L Z Z

Z V V

+=

LT

T

Z Z V

I +

=

shown in Fig. 2 , no current is taken from the supply sources ifthe receiver input currents, I IN , are equal to zero.

Fig. 1. Circuit modelRys. 1. Model uk ładu

We speak about voltage mode operation if:

(3)

Then, the in

uence of Z L on the value of V L is negligibly smalland:

(4)

A current mode operation takes place when:

(5)

In this case, the I current is almost independent of Z L and isgiven by:

(6)

Power taken from the voltage source results from losses in Z T (self-impedance plus conducting path) and power dissipatedby the Z L load.

The power losses in Z T are very low when operating involtage mode. This is because voltage across Z T is very lowin the voltage mode and I current is typically very low as well,due to a very large value of | Z L| . Thus, voltage mode operationis superior to the current-mode one as regards the conductingparts power losses.

As for the power dissipation in the Z L impedance, we of-ten have an opposite situation, i.e. current-mode operation ofa loading circuit, represented in Fig. 1 by Z L, may result ina more power-saving work than it is the case for the voltage-mode one. This is because current-mode circuits are bettersuited for low voltage supply and because they can consumeno energy in the absence of input signals (currents).

Other advantages of the current-modeoperationVery simple signal adding at one node

One of advantages of current-mode signal processing is anextremely simple and fast realization of signal addition. This isbecause the signals are currents and current summation canbe carried out in a single node, according to the Kirchhoff’s

current law, which is illustrated in Fig. 2. Notice, that input cur-rent, I IN, of the upper scheme receiver in Fig.1 is allowed toow out only, while the I IN current in the bottom scheme canow only in the opposite direction, i.e. ow into. In both cases

T L Z Z >>

T L V V

T L Z Z <<

T

T

Z V

I

Fig. 2. Current summation at the receiver inputRys. 2. Sumowanie pr ą dów na wej ściu odbiornika

Fast multiplication of current signalsFig. 3 presents a circuit suited for performing multiplicationoperations, provided that the transistors work in week inver-sion (subthreshold operation).

Fig. 3. Gilbert multiplier Rys. 3. Uk ład mno żą cy Gilberta

To achieve a multiplication effect, the relation describingdrain current, I i , as a function of gate-source voltage, V i , of theMOS transistors must be exponential, i.e. given by:

(7)

Then, one obtains:

(8)

(9)

From (8) and (9) it is seen, that output currents, I 2 and I 3, areproportional to the product of two input currents, I 1I B and I 4I B,respectively. Hence, the circuit functions as a current multi-plier.

inV i Ae I

41

4

1

41

12 if I I

I I I

I I I I

I B B <<+

=

41

1

4

41

43 if I I

I I I

I I I I

I B B >>+

=

Page 101: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 101/156

ELEKTRONIKA 3/2010 99

Some CMOS realizations of analog circuitssuitable for neuroprocessing

Fig. 4 shows a transconductance squarer, which convertsthe input voltage difference, V Y -V X , into the output current I o,according to [15]:

(10)

where K , K 5, K 7, and K 8 are coef cients of voltage to currentDC characteristics of the used transistors.

( )28

752 X Y o V V K

K KK I −= ,

In (11) and (12), n and K are real valued positive coef cients,dependent on the transistor sizes of the circuit.

The transconductne synapse shown in Fig. 6 is based ona differential pair M1-M2. This pair, however, is utilized in anatypical way. Gate source voltages of this pair, that for smallsignal operation are linearly related to the external V 2 and V 1 control voltages, here are not input signal of the pair, but playa role of signals controlling the synapse gain. Input voltage ofthis synapse is V in that controls the tail current of the M1-M2pair.

If gate-source voltages of M1 and M2 are linearly related toV 1 and V 2, output current, I 0, as a function of the V 1-V 2 voltagedifference, can be expressed as:

(13)

where A is some coef cient, and V th pinch-off voltage of thedifferential-pair transistors.The expression (13) holds when V in>2 V th [13].

Selected SPICE simulation results

In this section, results of SPICE simulations of the circuits pre-sented in the previous section ( Figs. 4-6 ), designed for a CMOS0.35 um process, are shown. Pinch-off voltage of NMOS tran-sistors is 0,4655 V and of PMOS ones is –0,617 V .

Transconductance differential squarer

Input voltages of the squarer, V X and V Y, were varied from 0 to2 V . Both the noninverting and inverting circuits were tested.Transistor sizes are shown in Table 1 .

Fig. 7 presents output current, I o, versus the V X -V Y inputvoltage difference. V X is varied from 0 to 2 V , while V Y is con-stant and equals 1,37 V . As can be seen, I o dependence onthe V X-V Y variations exhibits, in some range, a parabolic char-acter. Thus, the circuit functions as a transconductance dif-ferential squarer.

Square-root-extraction circuit

Transistor sizes of the current-mode square-root- nding cir-cuit of Fig. 5 are gathered in Table 2.

( )( )thino V V V V A I 2

21 −− ,

Fig. 4. Transconductance differential squarer Rys. 4. Transkonduktancyjny ró żnicowy uk ład podnosz ą cy dokwadratu

Fig. 6. Transconductance synapse controlled by V 2-V 1 voltagedifferenceRys. 6. Transkonduktancyjna synapse sterowana ró żnic ą napi ęć V2-V1

Fig. 5. Current-mode square-root-extraction circuitRys. 5. Uk ład pierwiastkuj ą cy pracuj ą cy w trybie pr ą dowym

In Fig. 5, a current mode circuit is presented which allowsus to extract square root of the input signal. When combinedwith the squarer of Fig. 4 , it creates a useful tool for hardwarecalculations of Euclidean distance in an analog way. Outputcurrent, I out , of the circuit of Fig. 3 is proportional to square rootof the input current, I in, and expressed by:

(11)

provided that the below give condition is satis ed [16]:

(12)

( ) inout I V V n K

I 122 − ,

( )2122V V

nK I in −>>

Page 102: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 102/156

ELEKTRONIKA 3/2010100

Tabl. 1. Channel width and length of the used transistorsTab.1. Szeroko ść i d ługo ść kana łu u żytych tranzystorów

Tran. M1 M2 M3 M4 M5 M6 M7

W [μm] 2.5 2.5 2.5 2.5 0.4 0.4 0.4

L [μm] 0.6 0.6 0.6 0.6 33 33 45

Tran. M8 M9 M10 M11 M12

W [μm] 6 0.4 6 2 2

L [μm] 0.35 45 0.35 0.5 0.5

Tabl. 2. Transistor channel widths and lengthsTab. 2. Szeroko ści i d ługo ści kana łów tranzystorów

Tran. M1 M2 M3 M4 M5 M6 M7

W [μm] 0.6 0.6 0.6 0.6 1.8 0.6 0.6

L [μm] 0.6 0.6 1.6 1.6 0.6 1.8 0.6

Fig. 7. Input/output DC characteristic of the circuit of Fig. 4(I o versus V X for V Y =1.37 V ): a) vertical I o scale of -800 nA tozero (bottom plot), b) vertical I o scale of -300 nA to zero (upper

plot)Rys 7. Pr ą dowo-napi ęciowa charakterystyka statyczna uk ładuz rys. 4 ( I o jako funkcja V x dla V y = 1,37 V): a) skala pionowa ( I o) od-1 uA do zera (wykres dolny), b) skala pionowa ( I o) od -300 nA dozera (wykres górny)

Fig. 8. DC transfer characteristics of the circuit of Fig. 5: a) out-put current (I out ) as a function of input one ( I in ) – upper plot, b)output current square (I out

2) as a function input current ( I in ) – mid-dle plot, c) derivative d (I

out)2 /dI

in as a function input current ( I

in)

– bottom plotRys. 8. Statyczne charakterystyki przej ściowe uk ładu z rys. 5: a)pr ą d wyj ściowy ( I out ) jako funkcja pr ą du wej ściowego ( I in) – wykresgórny, b) kwadrat pr ą du wyj ściowego ( I out

2) jako funkcja pr ą duwej ściowego ( I in ) – wykres ś rodkowy, c) pochodna d (I out

2)/dI in jakofunkcja pr ą du wej ściowego ( I in) – wykres dolny

Tabl. 3. Transistor channel sizes of the Fig. 6 synapseTab. 3. Wymiary kana łów tranzystorów synapsy z rys. 6

Tran. M1 M2 M3 M4 M5 M6 M7

W [μm] 9 9 9 9 1 3.5 1

L [μm] 10 10 0.4 0.4 10 2 50

Tran. M8 M9 M10 M11 M12 M13 M14

W [μm] 3.5 1 15 15 1 15 15

L [μm] 2 50 0.4 0.4 10 0.4 0.4

The main DC property of the circuit, i.e. its ability to performroot extraction, is illustrated in Fig. 8 . Voltages controlling thecircuit gain are V 1=0,98 V and V 2= 1 V . The upper plot presentsoutput current ( I out) versus the input one ( I in). A square-root-ex-traction character of this curve is evidently seen. To show, howaccurate is the root-extraction operation, the second from thetop plot presents square of the output current ( I out

2) versus thecircuit input current, I in, and a derivative of this current square

with respect to I in, i.e. d (I out)2/dI in, as a function of I n. In an idealcase, the ( I out

2) should be linearly dependent on I in. Note, thatthe circuit operation is close the ideal when the input currentchanges from about 170 nA to about 8.1 uA.

Transconductance synapse

In our 0.35 μm SPICE simulations of the synapse, length (L)and width (W) of the transistor channels were as shown inTable 3.

Fig. 9 presents power consumed by the synapse (upper)

and its output current (bottom) versus the input voltage V in. Ascan be seen, the circuit operates with low power and low out-put current I o. Note, that the synapse offers not only positive,but also negative values of the transconductance gain, de-

Page 103: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 103/156

ELEKTRONIKA 3/2010 101

pending on the V 2-V 1 voltage difference value. It is also seen,that the circuit functions as a transconductor for input voltageshigher than 1 V .

Prototyping

To experimentally test a usefullness of the analog-signal-ba-sed technique to implement neuropracessing in hardware,a prototype Kohonen network has been designed and fabrica-ted in a 0.18 μm CMOS technology.

Conclusions

The paper presents an analog CMOS technique that offers at-tractive features in signal processing. Positive as well as nega-tive aspects of such processing in the context of its applicationto neural networks were discussed. Factors in uencing theprocessing effectiveness have been outlined and superiority,under some conditions, of current-mode technique over thevoltage-mode one was clari ed. The current mode superiority

concerns signal processing performed locally on a small chiparea. Then, current mode processing speed is faster than thatoffered by voltage mode one, area occupied on chip is smal-ler and power consumption lower. In case of sending signalsfor larger distances within the chip, voltage-mode transmissionis better than the current-mode one. Suitability of the current-mode technique for hardware realizations of self-organizingnetworks, capable of learning on chip, have been proved inthe way of both computer simulations and measurements ofa fabricated prototype. The obtained results con rm theoreticalpredictions and reveal a great potential of the analog techni-que to improve neural network properties and extend the areaof their applications.

References [1] Kohonen T.: Self-organizing maps. Springer Verlag, Berlin, 2001. [2] Cauwenberghs G., Bayoumi M. A., Sanchez-Sinencio E.: Learn-

ing on silicon: Adaptive VLSI Neural Systems. Kluwer AcademicPublishers, 1999.

[3] Fakhraie S., Smith K. C.: VLSI-compatible implementations forarti cial neural networks. Kluwer Academic Publishers, 1997.

[4] Linares-Barranco B., Sanchez-Sinencio E., Rodriguez-Vazquez A., Huertas J. L.: A CMOS Analog Adaptive BAM with On-ChipLearning and Weight Refreshing. IEEE Transactions on NeuralNetworks, vol. 4, no. 3, 1993, pp. 445-455.

[5] Holler M., et al.: An Electrically Trainable Arti cial Neural Network(ETANN) with 10240 Floating Gate, Synapses. International JointConference on Neural Networks, June 1989, pp.191-196.

[6] Tala śka T., D ługosz R., Pedrycz W.: Adaptive Weight Change

Mechanism for Kohonens’s Neural Network Implemented inCMOS 0.18 m Technology. European Symposium on Arti cialNeural Networks (ESANN), Bruges, Belgium, 2007, pp. 151-156.

[7] Ahalt S.C., Krishnamurthy A.K., Chen P., Melton D.E.: Competi-tive learning algorithms for vector quantization. Neural Networks,vol. 3, 1990, p. 131-134.

[8] DeSieno D.: Adding a conscience to competitive learning. IEEEConference Neural Network, vol. 1, 1988, pp.117-124.

[9] Gatet L., Tap-Béteille H., Bony F.: Comparison Between Analogand Digital Neural Network Implementations for Range-Finding

Applications. IEEE Transactions on Neural Networks, vol. 20, no.3, March 2009.

[10] Shih-Lun Chen, Ho-Yin Lee, Yu-Wen Chu, Chiung-An Chen, Chin-Chun Lin, Ching-Hsing Luo: A variable control system for wirelessbody sensor network. IEEE International Symposium on Circuitsand Systems (ISCAS), 18-21, pp. 2034-2037, May 2008.

[11] Chen Y., Bastani F.: ANN with two-dendrite neurons and its weightinitialization. International Joint Conference on Neural Networks(IJCNN 1992), Baltimore, USA, 1992, pp.139-146.

[12] Macq D., Verleysen M., Jespers P., Legat J.-D.: Analog imple-mentation of a Kohonen map with on-chip learning. IEEE Trans-actions on Neural Networks.

[13] Wojtyna R., Tala śka T.: Improved Power-Saving Synapse for Adaptive Neuroprocessing on Silicon. IEEE Int. Conf. Signalsand Electronic Systems ICSES’2004, pp. 27-30 , Pozna ń 2004.

[14] Wojtyna R.: Current-mode analog memory with extended stor-age time for hardware-implemented neural networks. Elektronikanr 3/2009, pp. 34-38.

[15] Wojtyna R.: Simple CMOS transconductance-mode differen-tial squarer. IEEE Workshop Signal Processing’2005, pp. 171,Pozna ń 2005.

[16] Wojtyna R.: Current-mode analog square rooter for hardware

neuroprocessing. IEEE Workshop Signal Processing’2005,Pozna ń 2006.[17] D ługosz R., Tala śka T., Wojtyna R.: New binary-tree-based Win-

ner-Takes-All Circuit for Learning on Silicon Kohonen’s Networks.ICSES2006, Łód ź 2006.

Fig. 9. Power consumption (upper) and output current I o (bottom)versus V in for the synapse of Fig.6 for various values of the V G1 - V G2 voltage differenceRys. 9. Pobór mocy (u góry) i pr ą d wyj ściowy I o (na dole) w funkcjiV in synapsy z rys. 6 dla ró żnych warto ści ró żnicy napi ęć V G1 -V G2

Fig. 10. Layout (upper) and bonding (bottom) of an analog Koho-nen network prototype (0.18 μm CMOS process)Rys. 10. Topologia (u góry) i wyprowadzenia (na dole) prototy-powego uk ładu analogowej sieci Kohonena (technologia CMOS0,18 μm)

Fig. 10 presents microphotograph of layout (top picture)and bonding (bottom picture) of the prototyped self-organiz-

ing neural network. The network is cable of fast self-trainingwithin a chip using a WTA (Winner Takes All) unsupervisedmethod improved by implementing a conscience mechanism.Chip sizes of the chip are: 250 x 300 μm.

Page 104: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 104/156

ELEKTRONIKA 3/2010102

Orthogonal Frequency Division Multiplexing (OFDM) wasadapted to many future communication systems due to itssimple and elegant implementation resulting from usage ofcyclic pre x, IFFT/FFT based modulator and demodulator[1]. However, OFDM is commonly believed to have a poorspectral characteristic because of relatively high side lobesof adjacent carriers. This is the main reason of proposing the

alternative multicarrier modulation schemes for communica-tions purposes. One of the well known is Discrete WaveletMultiTone (DWMT), also recently proposed for high-speedcommunications over power lines under the name of Wavelet-OFDM [2]. The mentioned here main OFDM’s drawbacks canbe overcome by using specially designed lters. Unfortunately,the Wavelet-OFDM system do not use a guard interval whatcauses many dif culties with channel equalization [2] that areusually solved by computationally intensive solutions.

The high speed power line communication has to face withmany technical and regulatory obstacles but it seems to bean interesting alternative to the in-door wireless multimediastreaming due to the fact that it can ensure, both, very high bitthroughput and desired quality of service (QoS) [2]. However,in order to fully exploit the PLC advantages, it is rst neces-sary to reduce destructive in uence of a harsh power line en-vironment on the bit throughput [1, 3]. A performance compari-son of OFDM and Wavelet-OFDM modulators/demodulatorsin power line environment has been already widely studiedin many research papers [2, 4, 5] pointing out advantages ofboth approaches. But, in our opinion, in these papers the in u-ence of real power line channels and their typical disturbancesfor overall system performance has not been investigated insatisfactory way and, therefore, question concerning useful-ness of different modulators in PLC environment is still open.

This paper addresses investigation of PLC applicationaspects of three modulators: OFDM, Wavelet-OFDM [2, 5]and Circular Wavelet-OFDM [6], a special case of the realcircular Gabor transform modulator [7, 8]. Especially, we willpresent a new critical look on Wavelet-OFDM robustness tonarrowband interferences. We will show that simple OFDMcan achieve better results in conditions assuming high levelof coloured noise in the background. Furthermore, the OFDMis more susceptible to burst impulsive disturbances for whichapplication of Wavelet-OFDM seems to be bene cial. In turn,Circular Wavelet-OFDM with an easy equalization and re-duced spectral side lobes is somewhere in the middle andit is also suitable for practical applications in some circum-stances.

The paper has the following structure. In sections 2 and 3

we present short description of modulators used in our simu-lations unfolding also the difference between classical andcircular version of the Wavelet-OFDM as well as betweenOFDM. In section 4 we describe the simulation parameters

for tested modulators and present results for uncoded andcoded systems from simulations with: additive white Gaussiannoise, coloured noise, narrowband interferences and impul-sive disturbances. Finally, in the last section, we conclude ourresearch.

OFDM modulator

The block diagram of the OFDM transmultiplexer is presen-ted in Fig. 1 . Symbol W denotes the NxN inverse FFT matrixW(n, k) = exp(2 kn/N) √N where k, n = 0,1,…, N-1 (k – freque-ncy index, n – time index), matrices T and R stand for additionand subtraction of cyclic pre x having M samples:

(1)( )Mx N M M

N

− =

0 IT

I [ ] NxM N =R 0 I

OFDM VS wavelet-ofdm and circular wavelet-ofdmin high speed communication over power lines

(Porównanie efektywno ś ci zastosowania modulacji OFDM, Wavelet-OFDMi Circular-Wavelet-OFDM do transmisji szerokopasmowej

w instalacjach elektrycznych)

mgr in ż. ŁUKASZ ZBYDNIEWSKI, prof. dr hab. in ż. TOMASZ P. ZIELI ŃSKI

AGH University of Science and Technology, Kraków, Department of Telecommunications

u^

Prefix

T

IFFT

W h

P/Sx

u

noise

Prefix

R

S/Py

FFT

W *T

FEQ

E 0

E 0H=IH

YX

Fig. 1. OFDM modulator block diagramRys. 1. Schemat blokowy modulatora OFDM

and E 0 is a diagonal matrix of channel frequency equalizer:

(2)

with H (.) denoting a channel frequency response. P/S and S/Pstand for parallel-to-serial conversion and vice versa.

The following matrix input-output relation describes the en-tire system:

(3)

in which H lin is a matrix representing linear convolution witha channel impulse response h . If this response is shorter thanthe cyclic pre x then the following equality is satis ed:

(4)

resulting in perfect channel equalization: .

Wavelet-OFDM-like modulatorsWavelet-OFDM is an alternative multicarrier modulation sche-me which has been proposed for power line communication

( )0 2

1, 0,1,..., 1

k N

diag k N H π

= = −

E

( )*T0ˆ lin=u E W RH TW u

( )( )*T 2 , 0, 1,..., 1k lin N diag H k N = = −W RH TW π

ˆ =u u

Page 105: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 105/156

ELEKTRONIKA 3/2010 103

standard [9]. It is equivalent to Discrete Wavelet MultiTonesignaling [10]. The general idea is to replace discrete Fouriertransform with wavelet transform [10]. However, in practiceusually the cosine-modulated lter banks (extended lappedorthogonal transforms) are used [10, 11]. Wavelet-OFDM mo-dulator does not use any guard interval in the form of a cyclicpre x and can apply perfect or near-perfect reconstruction lters banks. Detailed information about used in Wavelet-OFDM equalization can be found in [12].

Circular Wavelet-OFDM (Circ Wav-OFDM) [6] is a spe-cial form of the Wavelet-OFDM in which the lter bank worksin circular manner inside each OFDM data frame and thecyclic pre x is used what enables simple FFT-based chan-nel equalization. One can conclude that in Circ Wav-OFDMsingle OFDM time slot with many frequency lags is repla-ced by higher number of time slots but with smaller num-ber of frequency lags. The Circ Wav-OFDM can be viewedas a real-value cosine-modulated circular Gabor modulator[7, 8] enabling ef cient time-frequency tiling inside eachframe.

A general block diagram of Circ Wav-OFDM signallingscheme is presented in Fig. 2 . Operation are performed in

the same way as in OFDM but Fourier matrix W is replacedby matrix F representing a modi ed discrete cosine transform(MDCT). Additionally, after synthesis and before analysis, in-put data are processed circularly for each data frame. Ourimplementation allows using four con gurations: 2 × 1024,4 × 512, 8 × 256 and 16 × 128 (number of time slots × numberof frequency slots). Perfect reconstruction lters are used intwo rst cases and near-perfect ones in the remaining two.More information can be found in [6].

PAPR analysisThe classical OFDM modulator suffers from a high peak toaverage power ratio (PAPR) what is an important problem inpractical applications. In particular, the A/D converters shouldhave a linear output characteristic what imposes higher restric-tions on their quality. Figure 3 presents the ComplementaryCumulative Distribution function of amplitude (CCDF) versusPAPR what is directly related to unwanted out-of-band power.

As one can see lower PAPR occurs for the modulator with

more time slots, although, the difference is not signi cant.

Fig. 2. Circular Wavelet-OFDM modulator block diagramsRys. 2. Schemat blokowy modulatora Circular-Wavelet-OFDM

u

GF=I

Prefix

T

Mod

Fh

P/Sx

u

noise

Prefix

R

S/P

FEQE 1

=WE 0W *T

yDem

G

E 1H=I

X

H

Simulation results and discussionSetup of parameters

Three modulators have been compared: OFDM, Wavelet-OFDM and Circular Wavelet-OFDM. The simulations wereperformed for ve scenarios of disturbances: additive whiteGaussian noise, coloured noise, narrowband interferenceswith and without coloured noise and impulsive disturbances(two levels of coloured noise have been assumed). Threetypes of PL channels have been simulated in order to addvariety to transmission conditions (only mean values are pre-sented below). Each channel had different constellation sizefor the QAM/PAM signaling. 64QAM/8PAM mapping wasused for a “good” channel, 16QAM/4PAM – for a “medium”channel, and 4QAM/2PAM for a “poor” one. Therefore, themodulation was changing according to power line environ-ment conditions. The random PL channel model presented in[13] was used. OFDM modulation had 2048 QAM symbols inone frame (the FFT size). In baseband simulations only 917

complex symbols were exploited. Wav-OFDM and Circ Wav-OFDM used 2*917 real PAM symbols. Sampling frequencywas equal 62.5 MHz. Transmitters scaled energy of sent fra-mes to the level of -70 dB [V 2/Hz].

Fig. 3. Complementary cumulative distribution function (CCDF)for circular and non-circular Wavelet-OFDMRys. 3. Dystrybuanta dla cyklicznego i niecyklicznego modulatraWavelet-OFDM

0 1 2 3 4 5 6 7 8 9 10 11 12PAPR (dB)

10 -3

10 -2

10 -1

10 0

C C D F

OFDM

(Circ) Wav-OFDM K = 2

(Circ) Wav-OFDM K = 4

(Circ) Wav-OFDM K = 8

(Circ) Wav-OFDM K = 16

Additive white Gaussian noiseFigure 4 (left) depicts results obtained for the standard OFDMmodulator and Wavelet-OFDM modulator working with four dif-ferent time-frequency grids (K denotes the number of time slotscorresponding to one OFDM frame). As we observe, problemswith an equalization cause that BER curves for SNR higherthan 50 dB start to split and the modulator with K = 2 performsbetter than the other ones but still worse than OFDM.

Different situation is observed in Fig. 4 (right) for four ver-sions of the Circular Wavelet-OFDM modulator. The perform-ance here is comparable depicting the same trend as abovebut in much smaller scale.

Coloured noise

The coloured noise is a characteristic feature of the PL trans-mission. In our simulation we have assumed that only thelevel of this noise in in nity is changing. Detailed informationabout this type of noise and its accurate speci cation can befound in [7, 14].

Figure 5 presents BER performance as a function of thecoloured noise level for Wavelet-OFDM (left) and Circ Wavelet-OFDM (right) modulators, respectively. The general trend is thatmodulators with a smaller number of time slots perform better.Only for Wav-OFDM, the modulator with 4 time slots performsworse than with 8 time slots. It can be explained as follows: themodulator’s prototype lter for K = 4 has slightly worse perform-ance since when circularity is not applied the design of this lterhas higher importance.

Narrowband interference without coloured noise

Initially, we performed simulations which do not include col-oured background noise, in order to investigate the suscep-tibility of modulators only to narrowband interferences. Thecommon opinion is that the OFDM modulator has poor per-

Page 106: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 106/156

ELEKTRONIKA 3/2010104

Fig. 5. Wavelet-OFDM (left) and Circular Wavelet-OFDM (right) BER performance for coloured noiseRys. 5. Bitowa stopa b łędu modulatorów Wavelet-OFDM (po lewej) i Circular Wavelet-OFDM (po prawej) dla ró żnych poziomów szumukolorowego

Fig. 6. Wavelet-OFDM (left) and Circular Wavelet-OFDM (right) BER performance for narrowband interference without backgroundcoloured noiseRys. 6. Bitowa stopa b łędu modulatorów Wavelet-OFDM (po lewej) i Circular Wavelet-OFDM (po prawej) dla interferencji w ą skopas-mowych bez szumu kolorowego t ła

10 20 30 40 50 60 70 80Eb/No (dB)

10 -5

10 -4

10 -3

10 -2

10 -1

10 0

B E R

Wav-OFDM K = 16

Wav-OFDMK = 4

Wav-OFDMK = 8

Wav-OFDMK = 2

OFDM

10 20 30 40 50 60 70 80Eb/No (dB)

10 -5

10 -4

10 -3

10 -2

10 -1

10 0

B E R

OFDM

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 16

Fig. 4. Wavelet-OFDM (left) and Circular Wavelet-OFDM (right) BER performance for AWGN channelRys. 4. Bitowa stopa b łędu modulatorów Wavelet-OFDM (po lewej) i Circular Wavelet-OFDM (po prawej) dla kana łu AWGN

-145 -144 -143 -142 -141 -140 -139 -138 -137 -136 -135Coloured noise level in dB (V 2/Hz)

10 -4

10 -3

10 -2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 8

Wav-OFDM K = 2

OFDM

-145 -144 -143 -142 -141 -140 -139 -138 -137 -136 -135Coloured noise level in dB (V 2/Hz)

10 -4

10 -3

10 -2

B E R

Circ Wav-OFDM K = 16

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 4Circ Wav-OFDM K = 2

OFDM

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -4

10 -3

10-2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 8

Wav-OFDM K = 2

OFDM

Without coloured noise

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -3

10 -2

B E R

Circ Wav-OFDM K = 16

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 2

OFDM

Without coloured noise

Page 107: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 107/156

ELEKTRONIKA 3/2010 105

formance because of its relatively high spectral side lobes.This was the main reason for introduction of lter banks, e.g.in ADSL, because they have better spectral containment. Inthe reported research every transmission was performed withthe use of 1024 random channels with 10 frames per channel.

Additionally, narrowband interferences were changing theircarrier frequencies linearly every 10-th frame and they werescanning every subcarrier of transmitted signal.

Figure 6 show the obtained BER performance for Wavelet-

OFDM and Circular Wavelet-OFDM. Small amplitudes work toOFDM advantage over two tested modulators. Only for higherlevel of narrowband interferences we observe their slight su-periority.

Narrowband interference with coloured noise

To make our simulations more realistic and adequate to thereal PL channel model, we additionally embedded a receivedsignal in a coloured noise. Results for Wav-OFDM are pre-sented in Fig. 7 for two levels of the coloured noise equal -

135 dB [V 2/Hz] and -145 dB [V 2/Hz], respectively. The sametransmission scenario was chosen for Circ Wav-OFDM – seeFig. 8 . We observe that coloured noise also works to OFDMbene t regardless the type of Wav-OFDM modulator.

Impulsive disturbances

Impulsive disturbances are the main reason of frames re-transmission in PL communication. We investigated perform-ance of OFDM, Wavelet-OFDM and Circular Wavelet-OFDM

in the presence of impulsive disturbances and simultane-ous coloured background noise. Impulses were modeled asdumped sinusoids with randomly changed parameters. Oneimpulse was composed of three sines generated in bandwidthfrom 1 to 15 MHz with amplitudes in the range of -250 and250 mV. Additionally, there were appearing in random mo-ments according to Gaussian statistics. Figures 9 (left) and 9(right) present results of Wav-OFDM for two levels of colourednoise. In gures 10 (left) and 10 (right) the same is done forCirc Wav-OFDM.

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -3

10 -2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 8

Wav-OFDM K = 2

OFDM

Coloured noise -135 dB[V 2/Hz]

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -3

10 -2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 8

Wav-OFDM K = 2

OFDM

Coloured noise -145 dB[V 2/Hz]

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -3

10 -2

B E R

Circ Wav-OFDM K = 16

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 2

OFDM

Coloured noise -135 dB[V 2/Hz]

0 2 4 6 8 10 12 14 16 18 20 Narrowband interference amplitude (mV)

10 -3

10 -2

B E R

Circ Wav-OFDM K = 16

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 2

OFDM

Coloured noise -145 dB[V 2/Hz]

Fig. 8. Circular Wavelet-OFDM BER performance for narrowband interference with background coloured noise at -135 dB [V 2 /Hz] (left)and at -145 dB [V 2 /Hz] (right) levelRys. 8. Bitowa stopa b łędu modulatorów Circular Wavelet-OFDM dla interferencji w ą skopasmowych z szumem kolorowym t ła o war-to ściach -135 dB [V 2 /Hz] (po lewej) oraz -145 dB [V 2 /Hz] (po prawej)

Fig. 7. Wavelet-OFDM BER performance for narrowband interference with background coloured noise at -135 dB [V 2 /Hz](left) and -145dB [V 2 /Hz] (right) levelRys. 7. Bitowa stopa b łędu modulatorów Wavelet-OFDM dla interferencji w ą skopasmowych z szumem kolorowym t ła o warto ściach-135 dB [V 2 /Hz] (po lewej) and -145 dB [V 2 /Hz] (po prawej)

Page 108: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 108/156

ELEKTRONIKA 3/2010106

Fig. 9. Wavelet-OFDM BER performance for impulsive disturbances with background coloured noise at -135 dB [V 2 /Hz](left) and -145dB [V 2 /Hz] (right) levelRys. 9. Bitowa stopa b łędu modulatorów Wavelet-OFDM dla zak łóce ń impulsowych z szumem kolorowym t ła o warto ściach -135 dB[V2 /Hz] (po lewej) oraz -145 dB [V 2 /Hz] (po prawej)

0 25 50 75 100 125 150 175 200

Impulse duration (µs)

10 -2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 2

Wav-OFDM K = 8

OFDM

Coloured noise -135 dB[V 2/Hz]

0 25 50 75 100 125 150 175 200

Impulse duration (µs)

10 -2

B E R

Wav-OFDM K = 16

Wav-OFDM K = 4

Wav-OFDM K = 2

Wav-OFDM K = 8

OFDM

Coloured noise -145 dB[V 2/Hz]

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -2

B E R

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 16

OFDM

Coloured noise -135 dB[V 2/Hz]

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -2

B E R

OFDM

Circ Wav-OFDM K = 4

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 8

Circ Wav-OFDM K = 16

Coloured noise -145 dB[V 2/Hz]

Fig. 10. Circular Wavelet-OFDM BER performance for impulsive disturbances with background coloured noise at -135 dB [V 2 /Hz] (left)and -145 dB [V 2 /Hz] (right) levelRys. 10. Bitowa stopa b łędu modulatorów Circular Wavelet-OFDM dla zak łóce ń impulsowych z szumem kolorowym t ła o warto ściach-135 dB [V 2 /Hz] (po lewej) oraz -145 dB [V 2 /Hz] (po prawej)

Surprisingly, Circ Wav-OFDM modulator performs worsethan its non-circular version. For small amplitudes of narrow-band interference the de nitive winner is OFDM. Only Wav-OFDM with two times slots has better performance in smallrange depending on coloured noise level. Additionally, we ob-serve again that for four time slots the prototype lter is slightlyworse for Wavelet-OFDM what is not the case for Circ Wav-OFDM performance in small range depending on colourednoise level. Additionally, we observe again that for four time

slots the prototype lter is slightly worse for Wavelet-OFDMwhat is not the case for Circ Wav-OFDM.In comparison to previous studies we observe signi cant

differences between the two tested lter bank-based modula-tors. Wavelet-OFDM is less affected by coloured noise: highernoise level only causes that the curves crossing is shifted to-wards longer impulses. Wav-OFDM modulators with 8 and 2

time slots have the lowest BERs for -145 dB [V 2/Hz] and -135dB [V 2/Hz], respectively. Two other modulators (with 16 and 4time slots) are much worse.

In case of Circ Wav-OFDM modulators we observe high sen-sitivity to coloured background noise. OFDM presents the lowestBER for the coloured noise level of -135 dB [V 2/Hz]. However, ut-terly different situation is observed in Fig. 10 (right) where simula-tions were performed for coloured noise at -145 dB [V 2/Hz] level.Now, Circular Wavelet-OFDM with 16 time slots presents the

lowest BER and OFDM has the highest BER. We observe alsothe slightly worse performance of modulator with 4 time slots.

Bit interleaved coded modulation

In communication systems different error correction methodscan be used. In the described below studies we have appliedserially concatenated and interleaved codes [14]. In this part

Page 109: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 109/156

ELEKTRONIKA 3/2010 107

comparison was performed only for Wavelet-OFDM and Cir-cular Wavelet-OFDM systems with 2 and 16 time slots andmaking use of different constellations: 4QAM/2PAM ( Fig. 11 )and 16QAM/4PAM ( Fig. 12 ). We took into account only impul-sive disturbances and two levels of coloured noise.

We have chosen concatenated coding scheme consistingof outer and inner encoder/decoder separated by the randominterleavers. We applied well known non-binary shortenedReed-Solomon codes for the outer encoder/decoder. These

codes were derived from a systematic RS code (n=255, k=192, t = 8) speci ed in Galoi eld GF(2 8). The shortening andpuncturing were applied to introduce different code rates. Theconvolutional codes with Viterbi’s decoder were used for theinner encoder/decoder with the constraint length 7 and thegenerator polynomials (octal) (171, 133). Parameters of theused codes are presented in table .

Fig. 12. Comparison of uncoded and coded 16QAM/4PAM systems for impulsive disturbances with background coloured noise at-135 dB [V 2 /Hz] (left) and -145 dB [V 2 /Hz] (right) levelRys. 12. Porównanie systemu transmisji 16QAM/4PAM niekodowanego i kodowanego dla zak łóce ń impulsowych z szumem koloro-wym t ła o warto ściach -135 dB [V 2 /Hz] (po lewej) oraz -145 dB [V 2 /Hz] (po prawej)

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -7

10 -6

10 -5

10 -4

10 -3

10 -2

B E R

OFDM

Wav-OFDM K = 2

Wav-OFDM K = 16

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 16

Uncoded 4QAM/2PAM

Coded 4QAM/2PAM

- 135 dB [V 2/Hz]

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -7

10 -6

10 -5

10 -4

10 -3

10 -2

B E R

OFDM

Wav-OFDM K = 2

Wav-OFDM K = 16

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 16

Uncoded 4QAM/2PAM

Coded 4QAM/2PAM

- 145 dB [V 2/Hz]

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -6

10 -5

10 -4

10 -3

10 -2

B E R

OFDM

Wav-OFDM K = 2

Wav-OFDM K = 16

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 16

Uncoded 16QAM/4PAM

Coded 16QAM/4PAM

-135 dB [V 2/Hz]

0 25 50 75 100 125 150 175 200Impulse duration (µs)

10 -6

10 -5

10 -4

10 -3

10 -2

B E R

OFDM

Wav-OFDM K = 2

Wav-OFDM K = 16

Circ Wav-OFDM K = 2

Circ Wav-OFDM K = 16

Uncoded 16QAM/4PAM

Coded 16QAM/4PAM

- 145 dB [V 2/Hz]

Fig. 11. Comparison of uncoded and with coded 4QAM/2PAM systems for impulsive disturbances with background coloured noiseat -135 dB [V 2 /Hz] (left) and -145 dB [V 2 /Hz] (right) levelRys. 11. Porównanie systemu transmisji 4QAM/2PAM niekodowanego i kodowanego dla zak łóce ń impulsowych z szumem koloro-wym t ła o warto ściach -135 dB [V 2 /Hz] (po lewej) oraz -145 dB [V 2 /Hz] (po prawej)

Parameters of error correction codes. Parametry kodów korekcyj-nych

Constellationsize

Outer code(Reed-Solomon)

GF(2 8)

Inner code(Convolutional

code)

Overallcode rate

4QAM/2PAM (32,24,4) (3,2) 1/2

16QAM/4PAM (64,48,4) (3,2) 1/2

We can conclude from Fig. 11 and 12 that for impulsivedisturbances coded systems perform much better than the un-coded ones and both Wavelet-OFDM and Circular Wavelet-OFDM with error correction are better than coded OFDM nomatter what the coloured noise level is. In this case the best isWavelet-OFDM system.

Page 110: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 110/156

ELEKTRONIKA 3/2010108

Conclusions

In this paper the in uence of coloured noise level on BERperformance of OFDM, Wavelet-OFDM and Circular Wa-velet-OFDM modulators working in power line environmenthas been investigated. It was shown that OFDM modulatorhas better performance in presence of coloured noise andnarrowband interferences. Wav-OFDM and Circ Wav-OFDMmodulators in turn have some advantages in the power lines

environment especially in case of relatively long impulsivedisturbances. Unfortunately, in particular Circ Wav-OFDMhas also a high level of sensitivity to a coloured noise whatresults in low performance when the noise is below certainlevel. Non-pre xed coded and uncoded Wavelet-OFDM, de-spite it simpli ed equalization, seems to provide promisingresults being resistant to both coloured noise and impulsivedisturbances.

Future research will be focused on testing different Wa-velet-OFDM modulators together with iterative forward errorcorrection methods. Such tests will de nitely approves ordeny usefulness of these signaling methods to power line orany other harsh communication environments.

References [1] Biglieri E., Galli S., et all.: Guest editorial power line commu-

nications. IEEE Journal on Sel. Areas in Comm., vol. 24, pp.1261-1264, July 2006 (special issue on PLC).

[2] Galli S., Koga H., Kodama N.: Advanced signal processing for PLCs:Wavelet-OFDM. Proc. IEEE ISPLC2008, pp. 187-192, April 2008.

[3] Pavlidou N., Han Vinck A.J., Yazdani J., Honary B.: Power linecommunications: State of the art and future trends. IEEE Comm.Mag., vol. 41, pp. 34–40, April 2003.

[4] Abad J., Torres L. M., Riveiro J. C.: OFDM and wavelets perform-ance comparison in power line channels. Proc. IEEE ISPLC2005,pp. 341–345, April 2005.

[5] Izumi K., Umehara D., Denno S.: Performance evaluation ofWavelet OFDM Using ASCET. Proc. IEEE ISPLC2007, pp.246-251, March 2007.

[6] Zbydniewski L., Zielinski T.P. Turcza P.: In uence of Time-Fre-quency Tiling on BER Performance in Discrete Wavelet MultitonePower Line Transmission. Proc. IEEE ISPLC2009, Dresden,29 Mar – 1 Apr 2009.

[7] Turcza P., Zbydniewski L., Zielinski T.: Circular real sine/cosineGabor transform modulator for Power Line Communication. 50thIEEE Global Telecomm. Conf. GLOBECOM-2007, Washington,26-30 Nov. 2007.

[8] Turcza P.: New TMUX for xDSL based on linear phase modu-lated lter banks. Proc. European Signal Processing ConferenceEUSIPCO’04, pp. 1935-1938, Vienna 2004.

[9] Galli, S. Logvinov, O.: Recent Developments in the Standardi-zation of Power Line Communications within the IEEE. IEEEComm. Mag., vol. 46, pp. 64-71, July 2008.

[10] Sandberg S.D., Tzannes M. A.: Overlapped discrete multi-tone modulation for high speed copper wire communications.IEEE J. on Sel. Areas in Comm., vol. 13, no. 9. pp. 1571-1585,Dec. 1995.

[11] Malvar H. S.: Signal Processing with Lapped Transforms. Nor-wood, Artech House, 1992.

[12] Ihalainen T., Stitz T. H., Rinne M., Renfors M.: Channel equali-zation in lter bank based multicarrier modulation for wirelesscommunications. EURASIP Journal of Applied Signal Process-ing, vol. 2007, ID 49389, 18 pages.

[13] Babic M., Hagenau M., Dostert K., Bausch J.: Theoretical postu-lation of PLC channel model. IST Integrated Project DeliverableD4v2. 0, The OPERA Consortium, March 2005.

[14] Lin S., Costello D.J., Jr.: Error Control Coding: Fundamentalsand Applications, Second Edition, Prentice-Hall, Upper SaddleRiver, New Jersey, 2004.

Page 111: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 111/156

ELEKTRONIKA 3/2010 109

Data published by World Health Organization (WHO) indica-te that cardiovascular system diseases are responsible forover 7 milion premature demises in the world per year. Oneof the main factor of cardiovascular risk is hypertension le-ading to arterial vessels rebuilding. It was found in clinical re-search that hypertension causes thickening and remodellingof intima-media complex (IMC). Therefore measurement of

intima-media thickness (IMT) of the common carotid artery inultrasound B mode examination (see Fig. 1 ) is recognized asan effective noninvasive method of state valuation of arterialvessels and cardiovascular risk [1].

Due to subtlety of IMC rebuilding process and presenceof strong disturbances in ultrasound images (speckles, re ec-tions, gaussian noise of electronics, echoes, deteriorations,shadows, low contrast in case of small structures, e.g. lumen-intima transition), IMT measurement is a dif cult time-consu-ming task. Estimation of IMC thickness progression in timeis an additional challenge due to that the IMT measurementerror is very high what results from signi cant distinctions insubjective IMT evaluation by different physicians.

In this context, development of an automatic, robust andperformed in real-time IMT estimation method is very impor-tant [2]. Taking into account features of the USG data source,such method has to consists of:− initial ltration aiming at reduction of disturbances and

edge enhancement,− initial image segmentation aiming at approximate calcula-

tion of boundaries of intima and adventita,− iterated improvement of the rst solution, e.g. using the

active contours method ( Snake ).In the method proposed in this paper the non-linear image

ltration was realized by means of modi ed speckle reducinganisotropic diffusion (SRAD) algorithm [3, 4]. For approximateestimation of intima and adventitia position the algorithm [2]has been exploited. Precise localization of these two layershas been done by modi ed active contour method [5].

Initial ltration of USG imageModel of USG image

Since multiplicative noise (called speckle) dominates in USGimages, luminance of their pixels is usually described by thefollowing mathematical model:

(1)

where u(i , j ) and f (i , j ) represent noise and signal samples,respectively, for image coordinates ( i , j ). Values of these sam-ples are modeled by random statistically-independent variab-les, i.e.

(2)

Additionally, stationary model is assumed for noise, i.e. itsmean value and variance are equal [6]:

(3)

Adaptive de-noising lter

Adaptive ltration of USG signal g (i , j ) addresses removing themultiplicative noise u(i , j ) from it. It was shown in [7] that such ltering can be realized when equation (1) is re-written into theform signal + noise :

(4)where:

represents additive noise depending on signal f (i , j ). Then, thelinear minimum mean square error (LMMSE) estimator [8]:

(5)

can be applied to (4) where a 0 represents local mean luminan-ce of the image and a 1 is its local deviation from it. Values ofcoef cients { a 0, a 1} should minimize the cost function:

Value of the above quadratic form is minimized by calculationof its partial derivatives in respect to parameters of a i estima-tor and setting them to zero:

In our case the following equations result:

)()()( ji, f ji,u= ji, g

)],([)],([)],(),([ ji f E jiu E = ji f jiu E

u= jiu E )],([ , 22 ])),([(u

σ =u jiu E −

),(]1),([),(),( ji f jiu+ ji f = ji g − ,

( ) ),(1]),([ ji f jiu= ji,n −

01ˆ a+ g a= f ,

])ˆ[()ˆ( 2 f f E = f Bmse − ,

1,20,)ˆ(

=i=a

f B

i

mse

∂∂

.

Automatic estimation of the intima-media thicknessof the common carotid artery

(Automatyczna estymacja grubo ś ci b łony wewn ętrzneji ś rodkowej t ętnicy szyjnej)

dr inż. PAWEŁ TURCZA1, prof. dr hab. in ż. TOMASZ P. ZIELIŃSKI2, prof. AIMÉ LAY-EKUAKILLE3,1 AGH University of Science and Technology, Department of Instrumentation and Measurement, Kraków, Poland

2 AGH University of Science and Technology, Department of Telecommunications, Kraków, Poland3 Dipartimento d’Ingegneria dell’Innovazione, University of Salento, Lecce, Italy

Fig. 1. Fragment of USG B mode image showing intima-mediacomplex (IMC) of the common carotid arteryRys. 1. Fragment obrazu USG prezentacji B pokazuj ą cy kompleksintima-media tętnicy szyjnej

Page 112: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 112/156

Page 113: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 113/156

ELEKTRONIKA 3/2010 111

While examining the lter proposed by Lee [6], authors in[3] observed that approximation of expected value of I ˉ i, j in (10)by means of 4 neighboring image pixels leads to the followingequation:

(11)

in which appears the factor:

being a discrete approximation of the Laplacian. This suggestspossibility of presenting equation (10) in a form of nonlineardiffusion, well-known among image processing professionalsfrom equation of the Perona-Malik lter [9]. Indeed, shiftingcoef cient (1- k ) under sign of the divergention one has [4]:

(12)

The above equation has now a form similair to original Pero-na-Malik lter [9]:

(13)

where denotes an image gradient, I 0 is an initial image to bedenoised and c ( x ) is a diffusion coef cient. The Perona-Mallik lter is very popular due to that it allows image denoising whi-le simultaneously sharps edges and precisely preserves theirpositions. This nice feature results from that the solution of(13), in moment t and for initial condition I 0, is equal:

where g ( x , y , t ) is a 2-D Gaussian function with variance √2t and ”*” denotes convolution. Argument of the coef cient c ( x )in (13) is magnitude of image gradient being the same timethe edge estimator. If equation (12) representsall-pass lter that preserves edges. In turn, givesisotropic smoothing by means of 2-D Gaussian window. The-refore, exchanging c ( x ) in (13) by (1- k ) in (12) leads to lterallowing reduction of multiplicative noise and the same timepreserving and sharpening edges.

In Figures 4 are presented effects of modi ed SRAD lterapplication to two USG images of common carotid arteries.

]4/))[(1(ˆ,1,1,,1,1,,t

jit

jit

jit

jit

ji ji,t

jit t

ji I I + I + I + I k + I = I −− −+−+∆+ ,

)4)(( ,1,1,,1,1,t jit jit jit jit jit

ji I I + I + I + I = ΔI −−+−+ ,

])div[(14

t t t Δt +t I k Δt

+ I = I −

| |( )[ ] I I c=t

I ∂∂ div , ( ) 00 I ==t I

( ) ( ) ( )t y, x, g y x, I =t y, x, I 0 , ( )

−2

22

2exp

2

1

σ

y+ x

σ π =σ y, x, g

0|)(| ≈I c 1|)(| ≈I c

Segmentation of USG image

After ltering USG images the intima and adventitia boundarycan be estimated. The involved algorithm steps are presentedbelow.

Itima layer search step

Lumen - Intima boundary is characterized by relatively highcontrast (see Fig. 1 ), so it can be easily detected using simple

iterative scheme based on image thresholding together witha continuity constraint for the intima line. For the initial esti-mation of intima boundary we are using algorithm proposed in[2]. It operates as follows. The intima boundary is representedby N points:

which at the beginning are placed at the upper edge of the r e-gion of interest (ROI) speci ed by physician. There is anothervector informing if corresponding point p i ( x i , y i ) can be moveddown or is already frozen and should not be moved.1. choose an unfrozen point p i ( x i , y i )2. If then freeze p i , go to step 4

3. if one of the neighbours of p i is frozen then

x p i at the posi-tion with higher gradient between points {( x i , y i − 1), ( x i , y i ),( x i , y i − 1)} and go to step 4 otherwise move p to the nextline, e.g. set its coordinate to ( x i , y i + 1)

4. stop if all the points have been xed5. go to step 1The threshold Tg value in our version of algorithm is chosenusing K-means clustering algorithm [10] with parameter k =3.

)(),...,( 111 N N N y , x p y , x p

g i μT pI ≥|)(|

Fig. 4. Images from Fig. 2 after anizotropic ltering (14) with marked lines showing boundaries lumen-intima and intima-mediaRys. 4. Obrazy USG z rys. 2 po anizotropowej ltracji (14) z zaznaczonymi liniami pokazuj ą cymi granice warstw lumen-intima orazintima-media

Fig. 5. Result of the initial intima layer searchRys. 5. Wynik pocz ą tkowej estymacji warstwy wewn ętrznej

Intima layer re nement step

Since USG images are heavily corrupted by noise the abovepresented simple algorithm fails for some images (see Fig. 5 ).Therefore, to x the problem, we propose the additional, re -nement step based on modi ed active contour algorithm [5].

Page 114: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 114/156

ELEKTRONIKA 3/2010112

An active contour is a parametric curve v (s )=[ x (s ), y (s )],s [0, 1] that moves through image plane to minimize theenergy functional:

(14)

Curve internal energy in (14) is de ned as:

and E image is suitable energy function.From calculus of variations we known that the curve that

minimize the above mentioned functional must satisfy theEuler equation:

where:

From the above Euler equation one gets necessary conditionfor extrema of functional (14):

(15)

It should be mentioned that ful llment of Euler equation is onlynecessary condition for extrema but it is not suf cient. Since itsful llment does not guarantee global optimality of the solution theinitial curve should be placed in close proximity to optimal one.

The solution to equation (15) can be found [5] using dyna-mic programming or nite elements method [11]. In that paperwe use the later one.

The moving of curve v (s ) in order to minimize functional(14) can be modeled by introduction of an additional parame-ter t to v de nition. At some distance from the optimal curvev *(s ) the equation (15) is not ful ll. By setting the right side ofthis equation to partial derivative of v with respect to t one getsequation which can be solved in iterative manner

Using discretization with a step h=1, ν i = ( x (i ), y (i )) for i =0,..., N and applying Euler backward method to the above equationone gets:

where: (16)

The above equation to be solvable for nodes v 0,... v N needs ap-propriate boundary condition. In traditional application snake isa closed curve so the boundary condition is circular like: v -1=v N -1

and v -2=v N -2. In our method, however the contour is open notclosed, so we propose symmetric like boundary condition:

ds sv , sv , sv F = E ss s snake ∫ 1

0

))()()(( , where

)()())(),(),(( int s E E s s s F image ss s += νννν

)|)(||)(|(21

)( 22int sv+β svα= s E ss s

02

2

= F ds

d + F

dsd

F ssv svv − ,

))(())()()((

sv E =v

sv , sv , sv F = F image

ss sv

∂∂

,

)())(),(),((

sαv=

v

sv sv sv F = F s

s

ss s sv

∂,

)())(),(),((

s βv=v

sv sv sv F = F ss

ss

ss s ssv ∂

0))(()()( = sv E s βv sαv image ssss ss −− .

)),((),(),(),( t sv E t s βvt sαv=t sv image ssss sst −−

))()(()464

()2(

12,11,111,

12,11,111,1

j f , j f v+vv+v

v β v+vvα= Δt

vv

y x+ ji+ ji+ ji,+ j+i

+ j+i+ ji+ ji,+ j+i ji,+ ji,

−−−−−−

−−

( ) iimage x x E =i f ∂∂ / , ( ) iimage y y E =i f ∂∂ / .

1210112 and −−− N + N N + N v=v ,v=vv=v ,v=v

In our method the contour can move only in y direction, nomove along X axis is allowed. In such a case equation (16)reduces to y component only and resulting snake evolutionequation can be written as

(17)

where A is pentadiagonal matrix with incorporated boundarycondition for open ended snake:

Since, the intima is characterized by large positive value ofy component image gradient, as an image energy function(edge indicator) the following one has been used:

The resulting lumen-intima boundary is presented in gurebelow.

( )

=

bb

b

b

bb

y

y

y

y

y

j N,

j N

j

j

j

+ j N,

+ j N

+ j

+ j

+ j

abc

babccba

ccabc

cbabcba

A

j N f

j N f

j f

j f

j f

y

y

y

y

y

γγ+ A=

y

y

y

y

y

00000

00

00000

,

),(

),1(

),2(

),1(

),0(

1,

2,

1,

0,

1

1

11,

12,

11,

10,

L

O

OM

O

MO

O

L

MMMI

c+b=bb,+a=a bb β =c β ,+α=b β ,+α=a Δt ,=γ 462/1 − .,

∂∂

∂∂ ∂∂ ∂∂

otherwise

0

2

22

, x I

> y I ,

y I +

x I

= E image .

Fig. 6. Result of the re nement step of intima layer searchRys. 6. Wynik poprawy estymacji warstwy wewn ętrznej

Adventitia layer search step

In the rst step of adventitia layer search process, curve re-presenting lumen-intima boundary (see Fig. 6 ) is moved be-hind intima layer to reduce wrong in uence of intima detec-tion upon adventitia layer search process. The lumen-intimaboundary is characterized by high, positive value of y imagegradient component. In turn, the intima-media boundary is

characterized by high value of y image gradient componentwith opposite sign. Therefore to move boundary away fromlumen-intima to the neighborhood of intima-media it is enoughto advanced it as long as y component of image gradient is

Page 115: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 115/156

ELEKTRONIKA 3/2010 113

positive with continuity constraint for the boundary line. Theresulting line is presented in Fig. 7 . In this gure we can ob-serve that boundary line is placed between two edges: lumen-intima and media-adventitia.

Results

Described automatic IMT estimation algorithm has been im-plemented in Matlab programming environment and with te-sted successfully. Weights α , β determining the snake beha-vior have been set to 1 and .1 respectively. Incoming imageshave been denoised using described algorithm (11) with 30iterations and step size Δt = 0.15.

Two USG images of common carotid arteries are presented in

Figure 6 while in Figure 7 one can see estimated lines lumen-inti-ma and intima-media. It is worth to mention that the method doesnot depend on parameters of USG instrumentation due to that no-ise coef cient C 2

u is directly computed (estimated) from fragmentof the image to be denoised (see rectangles marked in Fig. 2 ).

Conclusions

Ef cient algorithm for USG-based automatic estimation ofintima-media thickness of common carotid artery has beenproposed and described in the paper. The methods makesuse of well-known partial solutions (modules) that were put towork together. Symmetric like boundary condition has been

introduced in the applied active contour algorithm.

Fig. 7. Initial media contourRys. 7. Pocz ą tkowy kontur warstwy ś rodkowej

Next, before media-adventitia boundary estimation stepthe lumen-intima edge indicator should be removed fromE image function (image part above green line in Fig 7 ) in orderto eliminate its wrong in uence to estimation process. For me-dia-adventitia search we apply the same modi ed contour aswas used in the re nement step of lumen-intima estimation.

Resulting boundary line is presented in Fig. 8 .

Fig. 8. Final estimation results of lumen-intima and media-adventitia boundariesRys. 8. Ko ńcowe estymaty granic: świat ło t ętnicy – warstwa wewn ętrzna oraz warstwy ś rodkowa-zewn ętrzna (przydanka)

Fig. 9. The nal results for two exemplary USG images presented in Fig. 2Rys. 9. Wynik ko ńcowy estymacji dla dwóch przyk ładowych obrazów USG przedstawionych na rys. 2

References [1] Kwater A., Grodzicki T.: Ocena grubo ści ściany t ętnicy szyjnej

u chorych z nadci śnieniem t ętniczym. Nadci śnienie T ętnicze,2005, tom 9, nr 1, pp. 55-60.

[2] Ceccarelli M., De Luca N., Morganella A.: An Active Contour Ap-proach To Automatic Detection Of The Intima-Media Thickness.Proc. of IEEE Int. Conference on Acoustics, Speech and SignalProcessing, ICASSP 2006, vol 2, pp. 709:712.

[3] Yu Y., Acton S.: Speckle reducing anisotropic diffusion. IEEE Trans.Image Process., vol. 11, no. 11, pp. 1260-1270, Nov. 2002.

[4] Aja-Fernández S., Alberola-López C.: On the estimation of thecoef cient of variation for anisotropic diffusion speckle ltering.IEEE Trans. Image Processing, vol. 15, no. 9, pp. 2694-2701,

Sep. 2006. [5] Amini A. A., Weymouth T. E.,. Jain R. C.: Using Dynamic Pro-gramming for Solving Variational Problems in Vision. IEEETrans. on Pattern Analysis and Machine Intelligence, v.12 n.9,p. 855-867, September 1990.

[6] Lee J.: Digital image enhancement and noise ltering using localstatistics. IEEE Trans. Pattern Anal. Mach. Intell., vol. PAMI-2,no. 2, pp. 165-168, Feb. 1980.

[7] Kuan D. T., Sawchuk A. A., Strand T. C., C. P.: Adaptive noisesmoothing lter with signal-dependent noise. IEEE Trans. Pattern

Anal. Mach. Intell., vol. PAMI-7, no. 2, pp. 165-177, Feb. 1985. [8] Kay S. M.: Fundamentals of Statistical Signal Processing: Esti-

mation Theory. Prentice-Hall, Englewood Cliffs, NJ, USA, 1993. [9] Perona P., Malik J.: Scale-space and edge detection using

anisotropic diffusion. IEEE Trans. Pattern Anal. Mach. Intell., vol.PAMI-12, no. 7, pp. 629-639, Jul. 1990.

[10] MacQueen J. B.: Some Methods for classi cation and Analysisof Multivariate Observations. Proc. of 5-th Berkeley Symposium

on Mathematical Statistics and Probability”, Berkeley, Universityof California Press, 1:281-297[11] Cohen L., Cohen I.: Finite Element Methods for Active Contour

Models and Balloons for 2D and 3D Images. IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 15, pp. 1131-1147, 1991.

Page 116: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 116/156

ELEKTRONIKA 3/2010114

Lampy fali bie żą cej (LFB) s ą urz ą dzeniami pró żniowy-mi przeznaczonymi do wzmacniania mocy mikrofalowejw zakresie cz ęstotliwo ści od ok. 1 do dziesi ą tek GHz. Po-mimo stale rosn ą cego udzia łu elementów pó łprzewodni-kowych w dziedzinie mikrofalowych wzmacniaczy mocy,

lampy pró żniowe a w szczególno ści LFB pozostaj ą wci ąż niedo ścignione w wielu zastosowaniach. Chocia ż spraw-no ść tranzystorów mikrofalowych osi ą ga warto ści od oko ło40% w pa śmie L (1…2 GHz) do 20-30% w pa śmie Ku(12…18 GHz), to jednak sumaryczna sprawno ść wzmac-niaczy na nich zbudowanych jest ju ż znacznie ni ższa i nieprzekracza 25% w pa śmie L a dla wy ższych cz ęstotliwo ści

jest oczywi ście jeszcze mniejsza [7]. Tymczasem LFB z wie-lostopniowym kolektorem o obni żonym napi ęciu osi ą gaj ą sprawno ść 30…70% [4] w zakresie cz ęstotliwo ści do kilku-dziesi ęciu GHz.

Poziom mocy wyj ściowej LFB w trybie pracy ci ą głej znacz-nie przekracza uzyskiwane dotychczas warto ści dla poje-dynczych pó łprzewodnikowych modu łów wzmacniaj ą cych.Przyk ładowo w pa śmie L uzyska ć mo żna z pojedynczegotranzystora ok. 100 W [7], podczas gdy dla typowej LFB – 500W [8]. W pa śmie Ku stosunek ten pog łębia si ę do warto ści a ż 150:1 na korzy ść lamp fali bie żą cej.

I chocia ż sumowanie mocy pojedynczych modu łów po-zwala na konstruowanie wzmacniaczy pó łprzewodnikowycho większych poziomach mocy, to jednak znacz ą co podnosi toich cen ę i mas ę.

Równie ż w dziedzinie szeroko ści pasma przenoszenia LFBznacznie przewy ższaj ą uk łady pó łprzewodnikowe. Wzgl ędnepasmo przenoszenia typowej lampy ze spiral ą LO jest rz ę-du 50%, a specjalne wykonania o korygowanej dyspersji li-nii opó źniaj ą cej pozwalaj ą na wytwarzanie LFB pracuj ą cychnawet w dwóch oktawach. Tymczasem uk łady tranzystoroweoferuj ą 10…20%. Wydaje si ę więc, że z tych powodów, przy-najmniej w przewidywalnej przysz łości lampy pró żniowe falibie żą cej nie tra ą do lamusa.

Podstaw ą dzia łania LFB jest wspó łdzia łanie wi ą zki elek-tronowej z polem elektrycznym sygna łu b.w.cz. wprowadzo-nego do linii opó źniaj ą cej (LO), pozostaj ą cej w bezpo śred-nim s ą siedztwie wi ą zki ( rys. 1 ). Zadaniem LO jest obni żeniepr ędko ści fazowej propaguj ą cej fali elektromagnetycznej dowarto ści zbli żonej do pr ędko ści wią zki [1] – warunek synchro-nizmu. Elektrony wi ą zki pozostaj ą ce przez ca ły okres swojej„podró ży” wzd łuż LO, w stre e oddzia ływania tego samegopó łokresu (hamuj ą cego b ą dź przy śpieszaj ą cego) pola elek-

trycznego fali e-m, s ą odpowiednio opó źniane lub przy śpie-szane. Prowadzi to do post ępuj ą cego w czasie i przestrze-ni grupowania elektronów w paczki ( bunching ), o g ęsto ściładunku przestrzennego znacznie przekraczaj ą cej warto ści

pocz ą tkowe. Powsta ły zmienny pr ą d konwekcyjny wi ą zkielektronowej indukuje w LO adekwatny pr ą d w.cz. i w efekciewzrost nat ężenia pola elektrycznego fali elektromagnetycznej,kosztem średniej energii wi ą zki. Zasada zachowania ener-gii stawia tutaj twarde warunki: moc wyj ściowa LFB b ędziewiększa od mocy wej ściowej – zachodzi wzmacnianie, tylkowtedy, gdy pr ędko ść pocz ą tkowa elektronów wi ą zki przewy ż-sza pr ędko ść fazow ą fali propaguj ą cej od wej ścia do wyj ściastruktury opó źniaj ą cej. Indukowanie mocy w.cz. w LO odbywasię bowiem kosztem średniej energii wi ą zki elektronowej. Mocwią zki na ko ńcu przestrzeni oddzia ływania jest zatem mniej-sza od mocy wi ą zki na wlocie o:• moc przekazan ą do wyj ścia LFB w postaci wzmocnionego

sygna łu w.cz.,• sumaryczn ą moc strat mikrofalowych,• moc pr ą du wi ą zki elektronowej przechwyconej przez LO.

Przy za łożeniu a priori, że znany jest rozk ład liniowy pr ą -du przechwytu LO, obserwacja ta pozwala na makroskopowei analityczne podej ście do zagadnienia obliczania rozprasza-nia mocy w linii opó źniaj ą cej LFB. Alternatyw ą jest bowiemzastosowanie skomplikowanych i czasoch łonnych oblicze ń numerycznych analizuj ą cych ruch elektronów w z łożonychpolach: magnetycznym (pole uk ładu ogniskuj ą cego), z łożo-nym polu elektrycznym fali elektromagnetycznej sygna łu w.cz.i ładunku przestrzennego oraz wzajemnej ich interakcji. Za-gadnienie jest bardzo skomplikowane a opracowane metody

symulacyjne np. [2, 3] stosuj ą pewne uproszczenia i ich za-sadniczym celem jest obliczenie podstawowych parametrówmikrofalowych LFB: wzmocnienia, sprawno ści, mocy wyj-ściowej, charakterystyki cz ęstotliwo ściowej czy nieliniowo ści

Uproszczony analityczny model rozpraszania mocyw linii opó źniaj ą cej lampy fali bie żą cejmgr WALDEMAR WIEJAK, dr hab. in ż. ARTUR WYMYS ŁOWSKI

Przemys łowy Instytut Telekomunikacji SA Oddzia ł Wroc ławski, Politechnika Wroc ławska

Rys. 1. Przekrój wyj ściowej sekcji LFB: 1 – spiralna LO, 2 – prze-pust mikrofalowy, 3 – dwustopniowy kolektor, 4 – pr ęty cera-miczne, 5 – magnesy pier ścieniowe uk ładu ogniskuj ą cego, 6

– izolatory wysokiego napi ęciaFig. 1. Cross section of terminal section of TWT: 1 – helix SWS, 2

– RF feedtrought, 3 – two stage depressed collector, 4 – ceramicssupport roods, 5 – magnet rings of the focusing system, 6 – HVinsulator

12 3

4 5 6

Page 117: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 117/156

ELEKTRONIKA 3/2010 115

wzmocnienia. Zastosowanie takiego aparatu matematyczne-go dla okre ślenia rozk ładu przechwytywanego pr ą du wi ą zki,a w efekcie obci ążenia termicznego linii opó źniaj ą cej, wydajesię zagadnieniem jeszcze trudniejszym.

Z praktycznego punktu widzenia nawet przybli żone wy-znaczenie rozk ładu mocy strat pr ą du wi ą zki w LO jest wy-starczaj ą ce do okre ślenia termicznego obci ążenia strukturymikrofalowej, a tym samym do zaprojektowania konstrukcjiLFB o odpowiednim stopniu niezawodno ści. Proponowanerozwi ą zanie jest prób ą takiego w ła śnie spojrzenia na omawia-ne zagadnienie.

Bezpo średni ą przyczyn ą powstania przestawionego ni żejmodelu analitycznego by ła potrzeba wyznaczenia, jeszcze naetapie projektowym, pola temperatury spiralnej LO w LFB falicią głej o mocy wyj ściowej 400 W ( rys. 1 ). Lampa przeznaczo-na jest do pracy w urz ą dzeniach telekomunikacji satelitarneji troposferycznej.

Moc wi ą zki rozpraszana w linii opó źniaj ą cej

W przedstawianej analizie zak łada si ą , że LO przechwytujeelektrony wi ą zki spowolnione kosztem mocy generowanej falie-m i ca ła energia wydziela si ę w niej w postaci ciep ła. Je żeliJw(z) jest pr ą dem wi ą zki w punkcie z (rys. 2), Pw(z) moc ą wią zki w tym punkcie, a j(z) gęsto ścią pr ą du strat, wówczasmoc strat pr ą du wi ą zki wydzielan ą na odcinku dz przedstawi ć mo żna w postaci:

(1)

gdzie psw(z ) jest g ęsto ścią mocy strat w LO, zatem::

(2)

Zasadniczym problemem do rozwi ą zania zagadnienia wy-znaczenia rozk ładu g ęsto ści mocy strat w LO jest wyznacze-nie g ęsto ści pr ą du przechwytu linii opó źniaj ą cej jako funkcjipo łożenia. Nale ży tutaj zauwa żyć, że dla rzeczywistej LFB

mierzalnym parametrem sumarycznego obci ążenia pr ą dowe-go struktury LO jest warto ść pr ą du linii opó źniaj ą cej.Stanowi on sum ę pr ą du przechwytu LO przy braku sygna-

łu steruj ą cego ( P we =0 ), czyli w tzw. warunkach ogniskowaniastatycznego oraz pr ą du przechwytu – J a, powodowanego zja-wiskiem rozogniskowania moc ą mikrofalow ą .

W prawid łowych warunkach ogniskowania, gdy „wstrze-lona” w periodyczne, magnetyczne pole ogniskuj ą ce wi ą zkaelektronów transmitowana jest w kanale o zadanej średnicy(zwykle 0,4…0,6 średnicy LO), pierwszy sk ładnik sumy ogra-nicza swój udzia ł w zasadzie jedynie do obszaru wej ściowegostruktury opó źniaj ą cej. Otwór linii stanowi wówczas naturaln ą pu łapk ę dla elektronów emitowanych z obrze ża katody, któ-

rych trajektorie ruchu znacznie odbiegaj ą od przewidywanychze wzgl ędu na niezerow ą warto ść sk ładowej prostopad łej ichpr ędko ści pocz ą tkowej i b łędy geometrii wyrzutni. Dla typowejdwu- lub trzysekcyjnej LFB mo żna wi ęc go w dalszych rozwa-żaniach zaniedba ć, gdy ż w tych rozwa żaniach rozpatruje si ę wyłą cznie obci ążenie jej ostatniej sekcji.

Pr ą d J a jest wi ęc ca łką z g ęsto ści pr ą du przechwytu – j(z) (rys. 2), wzd łuż osi z , okre ślon ą na odcinku 0 – L ostatniejsekcji linii opó źniaj ą cej:

(3)

Charakterystyki rzeczywistych LFB wytwarzanych w OWPIT [5], przedstawione na rys. 3 pozwalaj ą na przyj ęcie za ło-żenia, że w typowych warunkach pracy lamp g ęsto ść pr ą duprzechwytu j(z) , mo żna przedstawi ć jako ci ą głą i monotonicz-ną funkcj ę mocy wyj ściowej lampy Pwy , niezale żnie od tegoczy analizowana jest LFB ma łej, czy du żej mocy. W komu-

psw(z)dz - moc wiązki rozpraszana na długości dz LO

Pw(z ) - lokalna moc wiązki elektronowej

j(z)dz - prąd wiązki przechwyconej na odcinku dz LO

Jw(z) - lokalny prąd wiązki elektronowej

P rf (z) - lokalny poziom mocy mikrofalowej w LO

z

P wy P we

U 0 J 0

v0

dz

Linia opóźniająca Wiązka elektronów

0 L

Rys. 2. Schemat przestrzeni oddzia ływania LFBFig. 2. Interaction space scheme of TWT

Rys. 3. Zale żno ści pr ą du linii opó źniaj ą cej spowodowanego roz-ogniskowaniem moc ą mikrofalow ą dla trzech ró żnych lamp wy-twarzanych w OW PITFig. 3. Slow wave structure current versus output microwave po-wer diagram for three different OW PIT’s TWTs

nikacie [6] przyj ęto upraszczaj ą ce za łożenie, że jest to za-leżno ść liniowa, co skutkowa ło znaczn ą koncentracj ą mocystrat w ko ńcowej cz ęści LO – a ż 81 W na ostatnich 4 cm jej

długo ści. Przeprowadzona analiza numeryczna pola tempera-tury wykaza ła, że maksymalna temperatura spirali przekraczawówczas 230 oC co, w kontek ście praktyki wydaje si ę za łoże-niem zbyt pesymistycznym.

Page 118: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 118/156

ELEKTRONIKA 3/2010116

Je żeli oddzia ływanie fali elektromagnetycznej na elektro-ny wi ą zki realizuje si ę poprzez pole elektryczne, to natural-nym wydaje si ę za łożenie, że g ęsto ść pr ą du przechwytu jestwprost proporcjonalna do si ły wywieranej na elektrony, a wi ęc

równie ż amplitudy nat ężenia pola elektrycznego E(z). Korzy-staj ą c z w ła ściwo ści, że moc przenoszona przez fal ę e-m jestwprost proporcjonalna do E 2 otrzymuje si ę zale żno ść:

(4)

gdzie k jest wspó łczynnikiem proporcjonalno ści.Dla środkowych cz ęstotliwo ści pasma pracy lampy nie pra-

cują zwykle w warunkach nasycenia. Moc mikrofalowa indu-kowana w strukturze opó źniaj ą cej P rf (z) ma wówczas posta ć funkcji wyk ładniczej [1, 4] o wzorze ogólnym:

(5)

gdzie: g jest wzmocnieniem jednostkowym, a tłumieniem jed-nostkowym, Pwe moc ą pocz ą tkow ą na wej ściu LO.

Korzystaj ą c z tego i z warunku normalizacyjnego (3) otrzy-muje si ę funkcj ę dystrybucji pr ą du przechwytu:

(6)

Lokaln ą warto ść pr ą du wi ą zki elektronowej Jw(z) wyzna-czy ć mo żna z warunku ci ą głości pr ą du. Je żeli J0 jest warto ś-cią pocz ą tkow ą pr ą du wi ą zki na wej ściu w obszar oddzia ły-wania ( z=0 ), to korzystaj ą c z (6) pr ą d w odleg łości z okre śla

wzór:

(7)

gdzie: χ , jest wspó łczynnikiem przechwytu linii opó źniaj ą cej.

Aby wyznaczy ć ostatni czynnik wyra żenia na g ęsto ść mocystrat wi ą zki (2) czyli lokaln ą mocy wi ą zki elektronowej Pw(z) ,nale ży zastosowa ć zasad ę zachowania energii dla procesówzachodz ą cych na odcinku dz przestrzeni oddzia ływania (8).

Przyrost energii fali elektromagnetycznej dErf(z) , induko-wanej w LO na d ługo ści dz oraz jednoczesne wydzielaniew niej ciep ła w wyniku bombardowania elektronowego dEc(z) ,i strat mikrofalowych w materia łach linii opó źniaj ą cej dEsrf(z) ,odbywa si ę wyłą cznie kosztem energii wi ą zki elektronowejdEw(z) (8).

(8)

Przyjmuj ą c za łożenie, że ca ła moc strat wydzielana w LO za-mienia si ę w niej na ciep ło pomijamy istnienie zjawiska emisji

j

wtórnej, emisji elektronów Auger, czy te ż emisji promieniowa-nia rentgenowskiego jako czynników o znaczeniu drugorz ęd-nym.

Poprzez ró żniczkowanie obu stron po czasie i zamian ę ko-

lejno ści ró żniczkowania przechodzimy do bardziej u żytecznejpostaci równania – bilansu mocy:

(9)

Nale ży zauwa żyć, że ostatni sk ładnik równania jest g ęsto ścią mocy strat wi ą zki elektronowej bombarduj ą cej LO lampy i opi-suje go wyprowadzona wcze śniej formu ła (2) uwzgl ędniaj ą cazale żno ści (6) i (7):

(10)

Sk ładnik przedostatni równania (9) jest g ęsto ścią mocy stratmikrofalowych w LO powodowanych stratami dielektrycznymii efektem naskórkowo ści. Okre śla je wspó łczynnik t łumienia

jednostkowego a i lokalny poziom mocy mikrofalowej Prf(z) :

(11)

Uwzgl ędniaj ą c te zale żno ści, równanie (9) przyjmuje osta-teczn ą posta ć:

(12)

Nale ży zauwa żyć, że powy ższe równanie ma sens zyczny jedynie w przedziale warto ści z = 0 …L, gdzie L jest d ługo ścią obszaru wzmacniania ze sta łą wzmacniania B.

W pozycji L moc mikrofalowa Prf(z) osi ą ga warto ść ocze-kiwan ą Prf(L)=Pwy, a jej wielko ść determinowana jest przezwarunek maksymalnej (rzeczywistej lub teoretycznej) spraw-no ści procesu przemiany energii:

(13)

Inaczej mówi ą c: dla z > L, a wi ęc po opuszczeniu przez elek-trony przestrzeni oddzia ływania, moc wi ą zki elektronowejPw(z) nie podlega zmianom.

Nale ży równie ż zauwa żyć, że w chwili opuszczania przezzmodulowan ą wią zk ę elektronow ą pierwszej sekcji LFB wy-gaszona zostaje ca łkowicie fala e-m w LO. Na wlocie drugiejsekcji jest ona ponownie indukowana w linii kosztem śred-niej energii wi ą zki. Warunki pocz ą tkowe funkcji spe łniaj ą cej

równanie (12) okre śla wi ęc zale żno ść : Pw(0)=U0*J0–Pwe .Rozwi ą zanie analityczne równania ró żniczkowego (12)dla takich warunków pocz ą tkowych ma nast ępuj ą cą po-sta ć:

Page 119: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 119/156

ELEKTRONIKA 3/2010 117

Gdzie: (14)

Rysunki 4 i 5 przedstawiaj ą dystrybucj ę mocy wi ą zki, opi-sywan ą funkcj ą (14) i pr ą du wi ą zki (7) dla przypadku projek-towanej w OW PIT lampy fali ci ą głej o mocy wyj ściowej max.500 W. Linia przerywana reprezentuje przypadek liniowej za-leżno ści g ęsto ści pr ą du strat j(z)=k*Prf opisany w pracy [6].

Rys. 4. Dystrybucja mocy wi ą zki elektronowej wg formu ły (14)dla lampy fali ci ą g łej 500 W pasma C. Linia przerwana reprezen-tuje przebieg uzyskany w pracy [6]Fig. 4. Distribution of electron beam power according to the for-mula (14) for the cw 500 W, C band TWT. Dashed line representsthe function obtained in [6]

Rys. 6. G ęsto ść mocy strat wi ą zki elektronowej wg (16) dla LFBfali ci ą g łej 500 W, pasma C. Linia przerywana reprezentuje przy-bli żenie analizowane w pracy [6]Fig. 6. Density of the beam current power dissipated in delayline C band, 500 W, cw TWT. Dashed line represents the functionobtained in [6]

Korzystaj ą c z wyj ściowej postaci zale żno ści (2) na g ęsto ść mocy strat w LO wywo łanych bombardowaniem elektronamiwią zki, formu ły rozk ładu g ęsto ści pr ą du strat w LO (6), formu-ły dystrybucji pr ą du wi ą zki (7) oraz funkcji dystrybucji mocywią zki (14), wyznacza si ę ostateczn ą jej posta ć:

(15)

Dla rzeczywistej LFB zachodz ą nast ępują ce zale żno ści: Pwe << Uo*J0 oraz a/g-a ≈ 0,05 Można wykaza ć, że w tych warunkach zaniedbanie w po-wyższym wzorze obu sk ładników wprowadza b łą d nie prze-kraczaj ą cy 1,4%. Przedstawiaj ą c dodatkowo moc wej ściow ą

jako funkcj ę mocy wyj ściowej, z warunku (5) ( Prf(L)=Pwy )uproszczona formu ła g ęsto ści mocy strat wi ą zki przyjmujeposta ć:

(16)

Rysunek 6 . przedstawia funkcj ę (16) dla danych identycz-nych jak na rys. 5 i 6 .

Ca łkowita g ęsto ść mocy strat w linii opó ź-niaj ą cej LFBOstatecznym celem przeprowadzonych rozwa żań jest wy-znaczenie funkcji rozk ładu g ęsto ści ca łkowitej mocy strat

w linii opó źniaj ą cej LFB, powstaj ą cych w trakcie jej pracy.Poza wyznaczonymi wy żej stratami, maj ą cymi swoj ą genez ę w bombardowaniu elektronowym LO nale ży uwzgl ędnić rów-nie ż straty mikrofalowe okre ślane wspó łczynnikiem t łumienia

Rys. 5. Dystrybucja pr ą du wi ą zki elektronowej wg formu ły (7) dla

lampy fali ci ą g łej 400 W pasma C. Linia przerwana reprezentujeprzebieg uzyskany w pracy [6]Fig. 5. Distribution of electron beam current according formula(7) for the cw 400 W, C band TWT. Dashed line represents thefunction obtained in [6]

Page 120: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 120/156

ELEKTRONIKA 3/2010118

α – sk ładnikiem sta łej propagacji fali elektromagnetycznej.W naszych rozwa żaniach reprezentuje go sta ła t łumienia jed-nostkowego a :

(17)

Gęsto ść mocy strat mikrofalowych psf(z) , wynikaj ą cą ze sko ń-czonego przewodnictwa elektrycznego materia łu linii opó źnia-

ją cej i stratno ści dielektrycznej zastosowanej ceramiki obliczasię z formu ły:

(18)

Wynikowa g ęsto ść moc strat jest wi ęc sum ą wyznaczonychwyżej g ęsto ści:

(19)

Rys. 7. Ca łkowita g ęsto ść mocy strat w LO projektowanej LFBfali ci ą g łej o mocy 500 W; psw-g ęsto ść mocy strat wynikaj ą caz bombardowania elektronami wiazki, psf-g ęsto ść mocy stratwynikaj ą ca ze strat rezystancyjnych, linia ci ą g ła reprezentuje ichsum ęFig. 7. Total density of the power dissipated in a new designed500 W cw TWT; psw-density of beam power dissipated in a helix,psf-density of RF losses, continuous line represents amount oftotal power density

Na rysunku 7 . przedstawiono poszczególne sk ładnikii ostateczn ą gęsto ść mocy strat dla omawianego przyk ładuobliczeniowego. Ca łkowita moc strat wynosi teraz 107 W, a naostatnie 4 cm przypada 66 W podczas, gdy w poprzednimprzybli żeniu [6] by ła prawie o 30% wi ększa.

Analiza termiczna struktury LFB

Uzyskane na drodze teoretycznej dane obci ążenia linii opó ź-niaj ą cej moc ą strat wykorzystano do analizy numerycznej roz-kładu temperatury. Na rys. 8 przedstawiono model numerycz-

ny lampy wykonany w programie ANSYS v.11, sk ładaj ą cy si ę z 6. cz ęści, tj. spirali wykonanej z ta śmy wolframowej, pr ętówwsporczych wykonanych z ceramiki berylowej, rurki-os łonypró żniowej ze stali nierdzewnej 1H18N9T, nabiegunników

wykonanych ze stali armco, magnesów SmCo oraz podstawywykonanej z aluminium.

Program ANSYS pozwala na analiz ę numeryczn ą zagad-nie ń z teorii pola, opisanych równaniami ró żniczkowymi cz ą st-

kowymi z wykorzystaniem metody elementów sko ńczonych.W przypadku analizowanej lampy mamy do czynienia z prob-lemem pól sprz ężonych, tzn. pola elektrycznego, termicznegooraz pola odkszta łce ń/napr ęże ń.

Kluczowym problemem modelowania rozk ładu temperatu-ry by ły wyznaczone analitycznie dane dotycz ą ce obci ążenialinii opó źniaj ą cej.

Ze wzgl ędu na nieliniowy charakter obci ążenia przyj ętoza łożenie, że rozpraszana moc w spirali mo że by ć zast ą pio-na ciep łem Joul’a wydzielanym w niej, w wyniku przep ływuzast ępczego pr ą du elektrycznego J, p łyną cego szeregowoprzez kolejne zwoje o ró żnej rezystancji.

Rys. 8. Model numeryczny lampy wykonany w programie AN-SYS; 1 – ceramiczne pr ęty wsporcze (BeO), 2 – spiralna LO(Mo),3 – magnesy pier ścieniowe uk ładu magnetycznego (SmCo), 4

– nabiegunniki magnesów (Fe), 5 – podstawa LFB (Al)Fig. 8. TWT’s numerical model in the ANSYS computer program;1 – ceramic support rods (BeO), 2 – helix SWS (Mo), 3 – magnetrings of the focusing system (SmCo), 4 – pole pieces of the mag-net rings

1

2

3

45

Na rysunku 8 reprezentuj ą je ró żne kolory pojedynczychzwojów. Adekwatna moc P i wydzielana w pojedynczym seg-mencie tak zamodelowanej spirali wynosi wi ęc:

gdzie ς i jest rezystywno ścią danego zwoju, l – d ługo ścią a s – polem przekroju ta śmy z której nawini ęto spiral ę.

Przyj ęto dodatkowo nast ępują ce za łożenia:• moc rozpraszana w LO jest odprowadzana tylko i wy łą cz-

nie na drodze przewodnictwa cieplnego do aluminiowejpodstawy lampy o zadanej arbitralnie temperaturze 343K,odpowiadaj ą cej granicznym warunkom eksploatacji LFB.Zaniedbano tym samym problem odprowadzania ciep łado otoczenia na drodze konwekcji i promieniowania jakopomijalnie ma ły,

• rezystancja cieplna styku materia łów jest równie ż zanie-

dbywalnie ma ła,• charakterystyki wykorzystanych do konstrukcji lampy ma-

teria łów opisano korzystaj ą c z w ła ściwo ści izotropowych, jednorodnych i liniowych. Tym samym, ich zachowania

sl

J P ii

2

ς=

Page 121: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 121/156

ELEKTRONIKA 3/2010 119

w szerokim zakresie temperatur mo żna by ło opisa ć przypomocy zbioru liczb opisuj ą cych ich w łaściwo ści termome-chaniczne.Celem oblicze ń numerycznych by ło wyznaczenie maksy-

malnej temperatury w LFB, w zale żno ści od charakteru i war-tości rozpraszanej mocy. W tym celu przyj ęto za łożenie, żemoc w lampie mo że by ć rozpraszana w sposób jednorodny( p(z)=constans ) bą dź niejednorodny (rozk ład rozpraszanejmocy w lampie okre ślono na podstawie przeprowadzonejanalizy teoretycznej (19). Rys. 9 przedstawia przestrzennyrozk ład temperatury struktury otrzymany dla niejednorodnegoobci ążenia spirali.

Ze wzgl ędu na zale żno ść warto ści temperatury maksymal-nej od warto ści ca łkowitej mocy rozpraszanej w LO koniecz-nym wydaje si ę jej oszacowanie.

Rys. 9. Wyznaczony rozk ład temperatury dla przypadku niejed-norodnego rozpraszania mocy – warto ść ca łkowita 107 WFig. 9. Distribution of temperature for the case of non-homoge-neous power dissipation in the helix – 107 W total power

Obliczenia numeryczne wykonano dla kilku warto ści roz-praszanej mocy w zakresie 35…125 W, zarówno dla przy-padku jednorodnego jak i niejednorodnego rozpraszaniamocy. Wyniki analizy numerycznej, w postaci zale żno ścitemperatury maksymalnej od warto ści rozpraszanej mocy,zosta ły przedstawione na rys. 10 .

Rys. 10. Zale żno ść temperatury maksymalnej spirali od ca łkowi-tej mocy rozpraszanej w lampieFig. 10. Maximum temperature of the helix as a function of totaldissipated power

Jak wida ć warto ść temperatury maksymalnej zale ży linio-wo od ca łkowitej mocy rozpraszanej w lampie i ponadto, ist-nieje du ża zale żno ść temperatury maksymalnej od charakterurozpraszanej mocy.

I tak, w przypadku rozpraszania niejednorodnego typu I [6]temperatura maksymalna LO jest wy ższa o 60 o niż przypadkurozpraszania niejednorodnego typu II (bie żą ce przybli żenie)dla du żych warto ści rozpraszanej mocy. Kolejnym etapemprojektowania b ędzie zastosowanie metod projektowanianumerycznego, w celu optymalizacji konstrukcji lampy podką tem obni żenia temperatury spirali. Powinno to przyczyni ć się do poprawy parametrów niezawodno ściowych projekto-wanych LFB.

Podsumowanie

Linie opó źniaj ą ce nowoczesnych lamp mikrofalowych to zwy-

kle delikatne struktury linii śrubowych o niewielkich rozmia-rach, nara żone na znaczne obci ążenia termiczne. Jedyn ą drog ą odprowadzania ciep ła na zewn ą trz obszaru pró żnio-wego jest przewodnictwo cieplne poprzez ceramiczne pr ętywsporcze. W tych warunkach, w obecno ści silnego promienio-wania mikrofalowego, pomiar maksymalnej temperatury linii

jest trudnym i kosztownym przedsi ęwzięciem. Opracowaniemetody symulacyjnej, pozwalaj ą cej na optymalizacj ę para-metrów cieplnych konstrukcji na etapie projektowym powinnostanowi ć zatem znaczne usprawnienie procesu powstawanianowej LFB.

Aktualnie w ramach projektu rozwojowego w łasnego -nansowanego przez MNiSW, powstaje Oddziale Wroc ław-skim PIT SA prototyp lampy fali ci ą g łej pasma C o mocy wyj-ściowej 400 W. Eksperymentalne wyznaczenie za pomoc ą kamery termowizyjnej i wielopunktowego pomiaru bezpo-średniego jej mapy temperatury pozwoli na wery kacj ę przy-

jętych za łoże ń. Mo żliwe b ędzie wyznaczenie rzeczywistejzale żno ści g ęsto ści pr ą du przechwytu od po łożenia i mocywyjściowej LFB. Opracowany model numeryczny przep ływuciep ła i zwery kowany model teoretyczny dostarcz ą narz ę-dzi projektowych zwi ększaj ą cych niezawodno ść lamp mikro-falowych.

Praca powsta ła w ramach projektu rozwojowego Nr 0 R00 001006 nansowanego przez MNiSW

Literatura

[1] Gilmour,Jr A.S.: Principles of Traveling Wave Tubes (ArtechHouse INC, 1994).

[2] Aissi A., Andre F., Doveil F.: Time Domain Model of a TravelingWave Tube (J.Plasma Fusion Research. SERIES, vol.8, 2009).

[3] Holloway M.A., Rodgers J., Antonsen T.: Modeling Nonlinearity inTraveling Wave Tubes, MURI Mid-Review Presentation, October3, 2008.

[4] Barker R.J., Booske J.H.,.Luhmann,Jr N.C, Nusinovich G.S.:Modern Microwave And Millimetre-Wave Power Electronics(IEEE Nuclear and Plasma Sciences Society, sponsor)

[5] www.pitow.wroc.pl[6] Wiejak W., Wymys łowski A.: Thermal analysis of TWT delay line

by combined theoretical and numerical approach, 33 th Interna-tional Conference and Exhibition, IMAPS–Poland 2009, Gliwice

– Pszczyna, 21-24.09.2009.[7] www.sedi.co.jp[8] www.teledyne-mec.com

Page 122: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 122/156

ELEKTRONIKA 3/2010120

Jedn ą z metod wykorzystywanych w diagnostyce klinicznej

jest cytometria, która jest oparta na pomiarach

zycznychi/lub chemicznych w ła ściwo ści pojedynczych komórek, a tak żecz ą steczek biologicznych o podobnych rozmiarach. W przy-padku cytometrii przep ływowej, pomiary wykonuje si ę pod-czas przep ływu przez mikrokana ł cz ą steczek zawieszonychw strumieniu p łynu [1]. Zawiesina komórek lub cz ą steczek jestzasysana do kuwety przep ływowej, otoczonej przez zw ęża-

ją cy si ę kana ł wype łniony szybciej p łyną cą ciecz ą os łaniaj ą -cą . P łyn zewn ętrzny zaw ęża zawiesin ę z centralnego kana łu,przekszta łca j ą w strumie ń szeregowo u łożonych komórek.Podczas tego procesu, zwanego ogniskowaniem hydrodyna-micznym, wymuszony zostaje liniowy przep ływ pojedynczychkomórek w celu ich kolejnego przesy łania do obszaru na-świetlanego zogniskowan ą wią zką świat ła [2].

Najcz ęściej stosowanym źród łem świat ła jest laser (np. la-ser argonowy o monochromatycznej wi ą zce świat ła o d ługo ści458, 488 lub 514 nm i o mocy 5…75 mW). Świat ło laseroweulega cz ęściowo rozproszeniu na badanych cz ą steczkach,a cz ęściowo jest przez nie poch łaniane . Rozpraszanie świat-ła jest zale żne od wewn ętrznej struktury komórki, jej rozmiarui kszta łtu [2,3]. Je żeli komórka jest znakowana uorochromem,to w okre ślonych warunkach staje si ę ona źród łem świat ła u-orescencyjnego o okre ślonej d ługo ści fali. W cytometrii cz ęstostosowanymi barwnikami uoroscencyjnymi s ą np. izocyjanianuoresceiny (FITC), Texas–red lub koerytryna (PE) [2,4].

Na rysunku 1 . przedstawiono schemat dzia łania cytome-tru przep ływowego. Obie wi ą zki, świat ło rozproszone i uo-rescencyjne, s ą analizowane przez detektor, zawieraj ą cy na

Miniaturyzacja cytometru przep ływowegomgr in ż. RAFA Ł SZCZYPI ŃSKI 1, mgr in ż. EL ŻBIETA JAB ŁOŃSKA-KUGLER 1,mgr in ż. ANNA BARANIECKA 1,2 , doc. dr hab. in ż. DOROTA G. PIJANOWSKA 1

1 Instytut Biocybernetyki i In żynierii Biomedycznej im. M. Na łęcza PAN, Warszawa2 Instytut Technologii Elektronowej, Warszawa

wej ściu fotodiody lub fotopowielacze i wzmacniacze.

W cytometrii przep ływowej do identy

kacji badanych komó-rek stosuje si ę równie ż przeciwcia ła sprz ężone z barwnikamiuorescencyjnymi. Przeciwcia ło skoniugowane z uorochro-mem ma zdolno ść przy łą czenia si ę do okre ślonego epitopu

– specy cznej cze ści antygenu, np. bia łka znajduj ą cego si ę na powierzchni b łony komórkowej lub wewn ą trz komórki.Dzięki temu w badanej próbce mo żna np. oznacza ć martwei żywe komórki, które ró żnią si ę epitopami powierzchniowymi[5]. W tabeli 1 umieszczono kilka wybranych uorochromówwraz z charakterystycznymi d ługo ściami fali.

Pomiar w cytometrach przep ływowych jest realizowanyprzy za łożeniu, że zmierzona warto ść uorescencji komórek,aktywowanych świat łem lasera jest proporcjonalna do liczbykomórek znakowanych uorochromem. Impulsy świetlne s ą zamieniane na impulsy elektryczne przez system fotodiodlub fotopowielaczy i wzmacniaczy selektywnych. Popraw ę selektywno ści pomiaru uzyskuje si ę dzi ęki zastosowaniu ltrów optycznych w torze pobudzenia i/lub emisji. Uzyska-ne dane s ą magazynowane, analizowane i przedstawianew postaci u żytkowej za pomoc ą systemu komputerowego.Zawieraj ą one ilo ściowe informacje o ka żdej analizowanejkomórce [2, 5].

Niektóre cytometry przep ływowe maj ą funkcj ę sortowa-nia FACS ( Fluorescence Activating Cell Storting ). W tymprzypadku uk ład jest dodatkowo wyposa żony w systemrozdzielaj ą cy komórki. Po hydrodynamicznym zogniskowa-niu próbki, ka żda cz ą steczka jest analizowana w uk ładzieoptycznym. Na podstawie uzyskanego sygna łu analitycz-nego w postaci świat ła rozproszonego i uorescencyjnego,zgodnie z kryterium selekcyjnym, cz ą steczki s ą rozdzielanew polu elektrycznym [5].

Tab. 1. Wybrane uorochromy stosowane w cytometrii przep ływo-wej [4]Tabl. 1. Selected uorochromes usefuled in ow cytometry [4]

Nazwa Długo ść faliwzbudzenia (nm)

Długo ść faliemisji (nm)

Jodek propidyny (PI) 488 617

Texas-red (PE) 488 615

Izocyjanian uoresceiny(FITC) 488 518

Paci c Blue ® 405 455Rys. 1. Zasada pomiaru w cytometrze przep ływowym [4]Fig. 1. Measurement principle of ow cytometer [4]

cząsteczka znakowana fluorochromem

filtr optycznyfiltry optyczne

płyn osłonowyzawiesina komórek

ogniskowaniehydrodynamiczne

rozpraszanie

fluorescencjarozpraszanie

Page 123: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 123/156

ELEKTRONIKA 3/2010 121

Od kilku lat o środki naukowo–badawcze intensywnie pra-cują nad miniaturyzacj ą cytometrów przep ływowych [6 –10].

Daje to wiele korzy ści. Urz ą dzenia staj ą si ę mobilne, a kosztich wytwarzania i eksploatacji znacznie si ę zmniejsza (nie-wielkie obj ętości p łynów, reagentów i materia łów, krótki czaspojedynczego testu oraz ma łe zu życie energii). Powstajerównie ż mo żliwość równoleg łej pracy kilku mikrourz ą dze ń lubich zestawiania w bardziej skomplikowane uk łady wielozada-niowe [11].

Coraz cz ęściej stosowanym materia łem konstrukcyj-nym dla potrzeb miniaturyzacji obok krzemu [12] i szk ła [7]

jest poli(dimetylosiloksan) [8, 11, 13]. PDMS jest niedrogim,elastycznym oraz optycznie przezroczystym (do 230 nm)polimerem, bardzo dobrze sprawdzaj ą cym si ę w kontakciez próbkami biologicznymi, poniewa ż nie wp ływa toksycznie

na komórki. Dodatkow ą zalet ą jest łatwo ść wytwarzania poli-merowych struktur i łą czenia ich ze szk łem, krzemem lub inn ą warstw ą polimeru [8, 11, 13].

Obecnie prace w zakresie konstrukcji i zastosowa ń cytome-tru mikroprzep ływowego s ą równie ż prowadzone w IBIB PAN.

Miniaturyzacja cieczowego cytometru prze-p ływowegoKlasyczny cytometr przep ływowy jest przeznaczony do pracyw specjalistycznych laboratoriach diagnostyki medycznej i wy-maga profesjonalnej obs ługi przez wysoko wykwali kowan ą kadr ę. Dlatego te ż, w wielu o środkach s ą prowadzone pracebadawcze nad miniaturyzacj ą cytometrów, tak aby by ło mo ż-liwe ich wykorzystanie w ró żnych sytuacjach, np. przy łóżkupacjenta ( point-of-care ), czy te ż w warunkach polowych [14] .

Do konstrukcji takich mikrouk ładów wykorzystuje si ę wspomniany wcze śniej poli(dimetylosiloksan) – PDMS, który

jest powszechnie stosowany w mikro uidyce. Pierwszy etapprocesu obejmuje przygotowanie prepolimeru PDMS (czyn-nik sieciuj ą cy z monomerem) i wykonanie odlewu na matrycyzawieraj ą cej wzory mikrokana łów, a nast ępnie jego usiecio-wanie w temperaturze 70°C. W ten sposób otrzymuje si ę p łyt-kę PDMS z mikrokana łami. W kolejnym etapie, aby uzyska ć

gotow ą struktur ę uk ładu mikroprzep ływowego, dwie p łytkiPDMS: z mikrokana łami i bez nich, łą czy si ę po ich aktywacji

w plazmie tlenowej [13, 15, 16, 17].W wielu znanych z literatury rozwi ą zaniach konstrukcyj-nych cytometrów mikroprzep ływowych jest zachowany podob-ny ogólny schemat ich budowy ( rys. 2 ), w pewnym zakresieodpowiadaj ą cy koncepcji schematycznie przedstawionej narys. 1 .

Analizowana próbka, wprowadzona wlotem 2 jest ogni-skowana hydrodynamicznie za pomoc ą p łynu os łonowego,podawanego dwoma wlotami 1 – z szybko ścią przep ływuwiększ ą od szybko ści przep ływu p łynu centralnego (próbki).Zogniskowany strumie ń próbki jest analizowany w obszarzedetekcji 3. W przypadku detekcji optycznej, impuls świetlny,o okre ślonej d ługo ści fali ( tab. 1 ) wzbudza znakuj ą cą substan-

cję

uoryzuj ą cą , powoduj ą c emisj ę świat ła o charakterystycz-nej d ługo ści fali. Sygna ł wyjściowy uzyskany w bloku detekcji jest proporcjonalny do nat ężenia świat ła emitowanego przezuorochrom.

W dalszej cz ęś ci przedstawiono przyk ładowe rozwi ą za-nia mikrocytometrów przep ływowych. Pierwszy z omawia-nych uk ładów ma wymiary 2 x 1 cm [18]. G łęboko ść i sze-roko ść wszystkich mikrokana łów s ą jednakowe i wynosz ą odpowiednio 150 i 200 μm. W tym przypadku, p łyn os łono-wy stanowi ła woda dejonizowana, podawana z szybko ścią 250 μl/min, natomiast badan ą próbk ą by ła zawiesina ludz-kich komórek nowotworowych bia łaczki ( human leukemia ) T,znakowanych jodkiem propidyny, której szybko ść dozowa-nia wynosi ła 83 μl/min. Uk ład optyczny zosta ł zintegrowanybezpo średnio z p łytką PDMS z mikrokana łami w ten sposób,że dwa świat łowody umieszczono w mikrokana łach prosto-pad łych do mikrokana łu przep ływowego, w którym nast ępo-wa ło ogniskowanie próbki. Strumie ń świat ła pobudzaj ą cegoprzechodz ą cy przez mikrokana ł wzbudza odpowiednio wy-znakowane moleku ły, natomiast świat ło emitowane przezuorochrom jest doprowadzane do detektora drugim świat-łowodem. Umieszczenie świat łowodów w mikrokana łachpozwoli ło na bardzo precyzyjne ustawienie ich wzgl ędemsiebie. Źród łem świat ła wzbudzaj ą cego by ł laser emituj ą cypromieniowanie o d ługo ści fali 532 nm. Szeroko ść zognisko-wanego strumienia próbki wynosi ła 24 μm, co okaza ło si ę bardzo po żą dane w przeprowadzanej analizie.

Rys. 2. Schemat budowy cytometru mi-kroprzep ływowego – widok z góry: 1 –wloty p łynu os łonowego, 2 – wlot próbkibadanej, 3 – obszar detekcji optycznej, 4

– wylot cieczyFig. 2. Scheme of micro ow cytometer:1 – inlets of sheath uid, 2 – inlet of in-vestigated sample, 3 – optical detectionarea, 4 – outlet

1 12

3

4

Rys. 3. Schemat mikrouk ładu: a) po łą czenie mikrokana łów (strza łki wskazuj ą kie-runek przep ływu cieczy); b) przekrój poprzeczny kana łu centralnego [18]Fig. 3. Scheme of microchannel: a) connection of microchannels (arrows showdirection of uid ow); b) cross-section of central microchannel [18]

a) b)

20µm

20µm

5µm5µm

Page 124: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 124/156

ELEKTRONIKA 3/2010122

i g łęboko ści 50 μm, prostopadle u łożonych wzgl ędem kana łucentralnego, wype łnionych cienk ą warstw ą żywicy SU-8. Dzi ę-

ki temu, świat ło lasera (He-Ne 633 nm) przechodzi wzd łuż mikrokana łu b ędą cego świat łowodem. Z przeprowadzonychbada ń wynika, że opisany mikrocytometr przep ływowy bar-dzo dobrze spe łnia swoje funkcje. Ka żda z analizowanychmoleku ł, gdy tylko znalaz ła si ę w obszarze detekcji, zosta ławykryta, co świadczy o du żej czu łości elementów urz ą dzeniawykrywaj ą cego.

W kolejnym rozwi ą zaniu cytometru mikroprzep ływowego(rys. 5 ) zbadano zale żno ść sygna łu wyj ściowego od k ą taustawienia detektora wzgl ędem kierunku świat ła wzbudza-

ją cego [22]. Wymiary wszystkich mikrokana łów by ły jedna-kowe i wynosi ły: g łęboko ść – 100 μm i szeroko ść – 300 μm.Materia ł badany stanowi ła wodna zawiesina kulek polistyre-

nowych odpowiednio o średnicy: barwy purpurowej 15,5 μmi zielonej 15 μm. Źród łem świat ła wzbudzaj ą cego by ły dwalasery: niebieski – 450 nm i czerwony – 645 nm. Szybko ść dozowania zawiesiny wynosi ła 83 μl/min, natomiast p ły-nu os łonowego (woda dejonizowana) – 250 μl/min. W tymuk ładzie uzyskano zogniskowany strumie ń zawiesiny kuleko szeroko ści 25 μm.

Mikrocytometr skonstruowany przez japo ńskich badaczyz Tokio [19] posiada innowacyjne rozwi ą zanie, polegaj ą ce

na zastosowaniu kana łu centralnego o zmiennym przekroju(rys. 3 ). Sposób wykonania takiego mikrokana łu w PDMSprzedstawiono w [13, 20]. Proces technologiczny polega ł nanak ładaniu odpowiedniej liczby warstw świat łoczu łych żywicoraz ich na świetlanie i wymywanie, a ż do uzyskania po żą da-nej matrycy, na któr ą jest wylewany PDMS.

Mikrokana ł centralny, podobnie jak mikrokana ły boczne,ma tak ą sam ą szeroko ść i głęboko ść 20 μm, natomiast w nie-wielkiej odleg łości przed punktem po łą czenia si ę wszystkichmikrokana łów, jego wymiary – szeroko ść i g łęboko ść – zmniej-szaj ą się do 5 μm. W dalszej cz ęści cytometru, kana ł central-ny znów rozszerza si ę do wymiarów pocz ą tkowych. Dzi ękitakiemu rozwi ą zaniu mo żna osi ą gn ąć bardzo ma łą szeroko ść

strumienia ogniskowanej cieczy. Jako materia ł testowy zasto-sowano wodn ą zawiesin ę kulek o średnicy 0,5 oraz 0,2 μmdozowan ą kana łem centralnym z szybko ścią 10 nl/min. P łynos łonowy stanowi ła woda dejonizowana, dozowana z szyb-kością 2000 nl/min. Szeroko ść zogniskowanego strumieniapłynu centralnego wynosi ła 1 μm, natomiast jej wysoko ść 6 μm. Jako źród ło świat ła wzbudzaj ą cego zosta ł użyty laserIR 1480 nm. Urz ą dzenie bardzo dobrze spe łniło swoj ą funkcj ę zarówno podczas ogniskowania, jak i detekcji oraz sortowa-nia.

Nieco odbiegaj ą cym budow ą , od wcze śniej opisanychmikrocytometrów przep ływowych jest szklany uk ład o wymia-rach 35 x 25 mm [21]. Sposób po łą czenia w nim mikrokana łówprzedstawiono na rys. 4 .

Rys. 5. Fragment cytometru mikroprzep ływowego w obszarzedetekcji optycznej : 1 – świat łowód ze świat łem wzbudzaj ą cym, 2

– mikrokana ł; a, b, c – k ą ty detekcji (45, 135, 180 O)Fig. 5. Part of the micro ow cytometer in the area of optical de-tection: 1 – optical ber with excitation light, 2 – microchannel;a, b, c – angles of detection (45, 135, 180 O)

Rys. 4. Fragment mikrouk ładu w obszarze po łą czenia mikroka-na łów [12]. Strza łki wskazuj ą kierunek przep ływu cieczyFig. 4. Part of the micro uidic system in the area of connection of

microchannels [12]. Arrows indicate direction of

uid

ow

W przypadku tego rozwi ą zania, zastosowano równolegleułożone wzgl ędem siebie mikrokana ły boczne i centralny, któ-rych szeroko ść wynosi 200 μm, natomiast g łęboko ść 25 μm.Odleg łości pomi ędzy nimi s ą rzędu kilkudziesi ęciu mikrome-trów. Za punktem po łą czenia si ę mikrokana łów, szeroko ść wynosi 100 μm. Dzi ęki takiemu rozwi ą zaniu mo żliwe sta ło si ę

jeszcze bardziej efektywne ogniskowanie. Przy przep ływiepłynu os łonowego na poziomie 0,2 μl/min (woda dejonizowa-na) oraz centralnego zawieraj ą cego zawiesin ę kulek POROS20 MC (wype łnienie kolumn chromatogra cznych) o średnicy20 μm – 0,05 μl/min, osi ą gnięto szeroko ść strumienia ognisko-

wanej cieczy ok. 10 μm. Elementy uk ładu detekcji optycznejzosta ły w sposób nowatorski zintegrowane z chipem. Zamiasttradycyjnych świat łowodów wbudowanych w mikrouk ład, linieświat łowodowe wytworzono w mikrokana łach o szeroko ści 80

Po przeprowadzeniu eksperymentów przy u życiu czerwo-nego i niebieskiego lasera, stwierdzono, że najlepsze wynikidetekcji s ą osi ą gane wówczas, gdy k ą t detekcji wynosi 180 ş.W przypadku lasera czerwonego, przy k ą tach 45 oraz 135 ş,piki detekcji by ły dwukrotnie ni ższe. Natomiast, w przypadkulasera niebieskiego, dla k ą tów detekcji 45 i 135 ş sygna ł wyj-ściowy by ł odpowiednio o śmio- i czterokrotnie ni ższy.

Z przeprowadzonej analizy wynika, że przy konstruowa-niu cytometru mikroprzep ływowego mo żna zastosowa ć wielerozwi ą za ń. Ka żde z nich ma pewne wady i zalety. Projektuj ą ctego typu mikrouk ład analityczny nale ży w pierwszej kolejno-ści wzi ąć pod uwag ę jego zastosowanie.

Niżej przedstawiono prace w łasne, maj ą ce na celu prze-prowadzenie bada ń ogniskowania p łynu w kanale centralnym

struktury testowej cytometru mikroprzep ływowego skonstruo-wanego w IBIB PAN. Docelowo, mikrocytometr b ędzie prze-znaczony do wykrywania ska że ń biologicznych pochodzeniabakteryjnego.

Page 125: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 125/156

ELEKTRONIKA 3/2010 123

Wst ępne wyniki bada ń dotycz ą ce ognisko-wania cieczy w kanale centralnym

Opracowanie i wykonanie struktury testowej cytometru mikro-przep ływowego sk łada ło si ę z kilku etapów. Najpierw zaprojek-towano i wykonano metod ą fotolitogra i matryce krzemowe,na których znajdowa ł się negatyw wzoru mikrokana łów, utwo-rzony w świat łoczu łej żywicy SU-8. Matryce ( rys. 6 ) zosta ły wy-konane w Instytucie Technologii Elektronowej w Warszawie.

Rys. 6. Matryce z negatywowymi (wypuk łymi) wzorami mikroka-na łów, wykonanymi w fotoczu łej żywicy SU-8Fig. 6. Masters with negative patterns of microchannels made inSU-8 photosensitive resin

Rys. 7. Zdj ęcie struktury testowej cytometru mikroprzep ływowe-go. Po lewej stronie widoczne s ą w ężyki doprowadzaj ą ce ciecz:ś rodkowy – p łyn centralny (woda) oraz dwa boczne – p łyn os ło-nowy (wodny roztwór manganianu(VII) potasu)Fig. 7. Picture of test structure of micro ow cytometer. In theleft-hand side – inlet tubes: middle one with central uid (wa-ter) and two side ones with aqueous solution of potassiumtetraoxomanganate(VII)

Rys. 8. Stanowisko do mikroskopowej obserwacji uk ładów mi-kro uidycznychFig. 8. Stand for microscopic inspection of micro uidic systems

Etap drugi procesu polega ł na wykonaniu odlewu prepoli-meru PDMS (monomer z czynnikiem sieciuj ą cym) na matrycyz SU-8 oraz jego usieciowaniu w temperaturze 70°C w czasie2 godzin. Jednocze śnie, w analogicznych warunkach utwo-rzono p łask ą p łytkę PDMS. Po zako ńczeniu procesu oddzie-lono p łytki od matryc, a w p łytce z mikrokana łami wyci ęto ot-wory wlotowe i wylotowe.

Nast ępnie, aby wytworzy ć struktur ę testow ą mikrocyto-metru, obydwie p łytki PDMS trwale po łą czono. W tym celuwykorzystano urz ą dzenie generuj ą ce plazm ę tlenow ą – myjk ę plazmow ą rmy Harrick Plasma. Przy aktywacji powierzchniobydwu p łytek, plazma mia ła nast ępują ce parametry: moc

– 10,2 W, cz ęstotliwo ść mikrofal – 13,56 MHz, przep ływ tle-nu – 0,6 SCFH, ci śnienie 600 mTorr. Aktywacja powierzchnipłytek trwa ła 30 s. Po tym czasie p łytki po łą czono ze sob ą i umieszczono w suszarce laboratoryjnej w temperaturze80°C na 2 godziny. Wymiary struktury wynosi ły 15 x 25 mm,natomiast jej wysoko ść 6 mm ( rys. 7 ). G łęboko ści wszystkichmikrokana łów w wykorzystanej strukturze wynosz ą 80 μm.

Szeroko ść kanalików z p łynem os łonowym wynosi 100 μm,a z p łynem centralnym – 80 μm.

W celu przeprowadzenia próby ogniskowania wi ą zki p ły-nu w kanale centralnym, u żyto dwóch modeli pomp strzy-kawkowych: CMA 102 i Gemini 88 KD Scienti c. Pierwszaz nich dozowa ła p łyn centralny – wod ę dejonizowan ą . Jakopłyn os łonowy zastosowano wodny roztwór manganianu(VII)potasu (barwa oletowa), który dozowano za pomoc ą pom-py Gemini 88 KD Scienti c. Jako aparatur ę pomocnicz ą doobserwacji i dokumentacji wyników u żyto stereoskopowegomikroskopu optycznego Olympus SZX 16 wraz z przeno śnymoświetlaczem Olympus Highlight 3100 oraz cyfrowego apara-tu fotogra cznego Olympus e520. Rys. 8 przedstawia zdj ęcieopisanego wy żej zestawu. Do podawania p łynów u żyto strzy-kawek insulinowych typu luer o pojemno ści 1 ml i średnicytłoka 5 mm, przy czym do dozowania p łynu os łonowego u żytodwóch strzykawek, natomiast p łynu centralnego – jednej.

Page 126: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 126/156

ELEKTRONIKA 3/2010124

Rys. 9. Ogniskowanie p łynu centralnego w pobli żu miejsca po łą czenia mikrokana łów.Szybko ść przep ływu p łynu os łonowego 20 μl/min, centralnego 10 μl/min

Fig. 9. Focusing of central uid at close vicinity to the connection of microchannels.Sheath uid ow rate – 20 μl/min, sample (central) uid ow rate – 10 μl/min

Rys. 10. Ogniskowanie p łynu centralnego w obszarze detekcji optycznej. Szybko ść przep ływu p łynu os łonowego 20 μl/min, centralnego 10 μl/minFig. 10. Focusing of central uid; place of detection area. Sheath uid ow rate 20μl/min, sample (central) uid ow rate – 10 μl/min

Wyniki odnosz ą ce si ę do przeprowadzonych testów og-niskowania p łynu centralnego przedstawiono na rys. 9 i 10,

na których pokazano odpowiednio zdj ęcia miejsca po łą czeniamikrokana łów i obszaru detekcji. Szybko ści przep ływu cieczypłynu os łonowego i centralnego (analizowanej próbki) wynosi-

ły odpowiednio – 20 i 10 μl/min. Dla wymienionych warunkówprzep ływu w kanale o szeroko ści 80 μm, wyznaczona szero-

kość strumienia zogniskowanej cieczy wynosi ła 9 μm.Zgodnie z w łasnymi rozwa żaniami teoretycznymi potwier-dzonymi eksperymentem, szeroko ść zogniskowanego stru-

mienia jest w przybli żeniu proporcjonal-na do stosunku szybko ści przep ływówpłynu centralnego i p łynu os łonowego.Zale żno ść eksperymentaln ą uzyska-ną w uk ładzie z kana łem o szeroko ści80 μm przedstawiono na rys. 11 . W mia-r ę oddalania si ę od punktu po łą czeniastrumieni p łynu os łonowego i p łynucentralnego obserwuje si ę stopniowerozmycie granic pomi ędzy tymi p łynami.

Wynika ono z dyfuzyjnego mieszaniasię obydwu cieczy. Poniewa ż kana ł cen-tralny jest stosunkowo krótki, przy wylo-cie mikrokana łu nadal mo żna odró żnić strumienie p łynu os łonowego i central-nego. Zastosowanie p łynu os łonowegoo w ła ściwo ściach hydrofobowych, praw-dopodobnie spowoduje zmniejszeniezjawiska dyfuzyjnego mieszania cieczyw mikrokanale.

Na podstawie bada ń przedstawio-nych w pracach [18, 19, 21] oraz prze-prowadzonych w IBIB PAN dotycz ą -cych ogniskowania hydrodynamicznegomo żna stwierdzi ć, że zaprojektowanyuk ład mikroprzep ływowy mo że zosta ć wykorzystany w mikrocytometrach doogniskowania próbek zawieraj ą cych za-wiesin ę mikrocz ą steczek lub komórek.Kolejne badania b ędą mia ły na celuprzetestowanie struktur mikrocytome-trów przep ływowych o ró żnych kon gu-racjach i wymiarach mikrokana łów.

Wnioski

Badania nad miniaturyzacj ą cytometrówprzep ływowych, prowadzone w ró ż-nych o środkach naukowych wskazuj ą ,iż opracowane tam uk łady, oprócz pod-kre ślanych w publikacjach zalet, maj ą równie ż ró żnego rodzaju wady. Eks-perymentalna ocena rozpatrywanychuk ładów b ędzie podstaw ą do wyelimino-wania cech ujemnych podczas prowa-dzenia w łasnych prac konstrukcyjnychdotycz ą cych mikrocytometrów przep ły-wowych, a szczególnie ogniskowaniahydrodynamicznego.

Mikrocytometr przep ływowy nie jest

rozwi ą zaniem konkurencyjnym dla kla-sycznego cytometru przep ływowego,lecz komplementarnym urz ą dzeniem,s łużą cym do wst ępnej analizy próbek

Page 127: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 127/156

ELEKTRONIKA 3/2010 125

w przypadku braku dost ępu do profesjonalnej aparatury ba-dawczej. Niew ą tpliwą zalet ą uk ładu mikroprzep ływowego jest

jego prosta obs ługa oraz niewielkie koszty eksploatacji. Obs łu-ga tego przyrz ą du nie b ędzie wymaga ła wysoko wykwali ko-wanego personelu. Urz ą dzenie ma niewielkie rozmiary, dzi ękiczemu b ędzie mo żliwe jego u żytkowanie poza laboratoriumanalitycznym, praktycznie w dowolnych miejscach.

Prace nansowane z projektu badawczego MNiSW nr PBZ-MNiSW-DBO-03/I/2007.

Literatura [1] Chung T. D., Kim H. Ch.: Recent advances In miniaturized micro u-

idic ow cytometru for clinical use. Electrophoresis, 4511-4520, 28,2007.

[2] Riley R. S., Idowu M.: Department of Pathology Medical Collegeof Virginia/VCU Health Systems Virginia Commonwealth Univer-sity Richmond. VA Principles and Applications of Flow Cytom-etry; http://www.pathology.vcu.edu.

[3] Kaczmarek A., Osawa T., Leporowska E., Mackiewicz A.: Rolai miejsce cytometrii przep ływowej w diagnostyce klinicznej.Wspó łczesna Onkologia, 366 – 373, 6, 2002.

[4] Kobelstein L.: Flow Cytometry, cheaper lasers and developmentof more uorochromes. ECE 5930 Biophotonics, 2006. [5] Rahman M.: Introduction to Flow Cytometry; http://www.abdsero-

tec.com

[6] Kim J. S., Anderson G. P., Erickson J. S., Golden J. P., Nasir M.,and Ligler F. S.: Multiplexed Detection of Bacteria and ToxinsUsing a Micro ow Cytometer. Analytical Chemistry, 5426 – 5432,

vol. 81, no. 13, July 1, 2009. [7] Holmes D., She J. K., Roach P. L., Morgan H.: Bead-based im-munoassays using a micro-chip ow cytometer. Lab Chip, 1048

– 1056, 7(8), 2007. [8] Hur S. C., K Tse H. T., Carlo D. C.: Sheathless inertial cell ordering for

extreme throughput ow cytometry. Lab Chip, 274 – 280, 10, 2010. [9] Golden J. P., Kim J. S., Erickson J. S., Hilliard L. R., Howell P. B.,

Anderson G. P., Nasir M., Ligler F. S.: Multi-wavelength micro owcytometer using groove-generated sheath ow. Lab Chip, 1942

– 1950, 9, 2009.[10] Ateya D. A., Ericson J. S., Howell Jr P. B., Hilliard L. R., Golden

J. P., Ligler F. S.: The goog, the bad, and the tiny: a review of mi-cro uidic cytometry. Anal Bioanal Chem, 1485 – 1498, Vol. 391,No.5, July, 2008.

[11] Sia S. K., Whitesides G. M.: Micro uidic devices fabricated inpoly(dimethylsiloxane) for biological studies. Electrophoresis,3563 – 3576, vol. 23, 2003.

[12] Bernini R., De Nuccio E., Brescia F., Minardo A.: Developmentand characterization of an integrated silicon micro ow cytom-eter. Anal Bioanal Chem 1267 – 1272, Vol. 386, 2006.

[13] Szczypi ński R., Pijanowska D. G.: Technologia i zastosowaniepoli(dimetylosiloksanu) – PDMS w mikrouk ładach analitycznych.Elektronika, nr 11, 2008.

[14] Gruden C., Skerlos S., Adriaens P.: Flow cytometry for microbialsensing in environmental sustainability applications – current statusand future prospects. FEMS Microbiology Ecology, 37-49, 49, 2004.

[15] Duffy D.C., Cooper McDonald J., Schueller O. J. A., Whitesides G.M.: Rapid Prototyping of Micro uidic Systems in Polydimethylsi-loxane. Analytical Chemistry, 4974 – 4984, vol. 70, no. 23, Decem-ber 1, 1998.

[16] Lam E., Ngo T.: Manufacturing a PDMS micro uidic device viaa Silicon Wafer Master. Harvard-MIT Division of Health Sciencesand Technology, HST. 410J: Projects in Microscale Engineeringfor the Life Sciences, Spring 2007, Course Directors: Prof. DennisFreeman, Prof. Martha Gray, and Prof. Alexander Aranyosi, 2007.

[17] Cooper McDonald J., Whitesides G. M.: Polydimethylsiloxaneas a Material for Fabricating Micro uidic Devices. Accounts ofChemical Research, 35/7, 2002.

[18] Bernini R., De Nuccio E., Brescia F., Minardo A., Zeni L., Sarro P.M., Palumbo R., Scar M. R.: Development and characterizationof an integrated silicon micro ow cytometer. Anal Bioanal Chem,1267–1272, 386, 2006.

[19] Arakawa T., Shirasaki Y., Aoki T., Funatsu T., Shoji S.: Three-dimensional sheath ow sorting microsystem using thermosensi-tive hydrogel. Sensors and Actuators A, 99–105, 135, 2007.

[20] Yun K.-S., Yoon E.: Fabrication of complex multilevel microchan-nels in PDMS by using threedimensional photoresist masters.Lab Chip, 245–250, 8, 2008.

[21] Lee G.-B., Lin C.-H., Chang G.-L.: Micro ow cytometers withburied SU-8/SOG optical waveguides. Sensors and Actuators A,165–170, 103, 2003.

[22] Tung Yi-Chung, Zhang M., Lin C.-T., Kurabayashi K., Skerlos S.J.: PDMS-based opto- uidic micro ow cytometer with two-color,multi-angle uorescence detection capability using PIN photodi-odes. Sensors and Actuators B, 356-367, 98, 2004.

Rys. 11. Zale żno ść mi ędzy szeroko ści ą hydrodynamicznie zog-niskowanego strumienia cieczy (d) i stosunkiem szybko ściprzep ływu p łynu centralnego do os łonowego (q C /q O) w uk ładzieo szeroko ści kana łu 80 μm. Szybko ść przep ływu p łynu os łono-wego by ła sta ła i wynosi ła 20 μl/minFig. 11. Dependence between width of hydrodynamically fo-cused spout of central uid (d) and ratio of ow rates of centraland sheath uid (q C /q O) in the system with 80 μm wide channel.Flow rate of sheath uid was constant – 20 μl/min

0

4

8

12

16

20

0 0,2 0,4 0,6 0,8 1 1,2

qc/qo

d [ µ m

]

Page 128: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 128/156

ELEKTRONIKA 3/2010126

W pracy [1] przedstawiono podstawowe poj ęcia i informacjedotycz ą ce informatyki kwantowej i jej zastosowania do krypto-gra i. Opisano w niej zasady kryptogra i kwantowej i dzia łanieca łkowicie bezpiecznego kana łu dystrybucji klucza wykorzy-stuj ą cego protokó ł BB84 [2], co w kryptogra i jest zagadnie-niem zasadniczym. Do kwantowej dystrybucji klucza zapew-niaj ą cej pe łne bezpiecze ństwo transmisji mo żna wykorzysta ć

te ż zjawisko spl ą tania fotonów, co pokaza ł w swojej rozprawiedoktorskiej [3] A.K. Ekert, polski zyk, absolwent UniwersytetuJagiello ńskiego, obecnie profesor zyki kwantowej na Uniwer-sytecie w Cambridge.

Spl ą tanie

Mechanika kwantowa zak łada, że przed pomiarem wielko-ści kwantowej mierzona zmienna nie ma ustalonej warto ści,a jedynie mo żna mówi ć o rozk ładach jej prawdopodobie ństwa.Istniej ą jednak tzw. stany spl ą tane par obiektów kwantowych,które maj ą tak ą właściwo ść, że gdy dokonujemy pomiaru pew-nej wielko ści charakteryzuj ą cej obiekt, otrzymujemy zawszeprzeciwne wyniki (pe łna antykorelacja). Tego rodzaju obiektemmog ą być m. in. kubity w postaci spolaryzowanych fotonów.

Stan spl ą tany polaryzacji dwóch fotonów ma tak ą właści-wość, że je żeli b ędziemy mierzy ć polaryzacje obu fotonów,używaj ą c dwóch identycznie ustawionych, ale odleg łych odsiebie polaryzatorów, to zawsze otrzymamy dwie przeciwnepolaryzacje. Natomiast zmierzone polaryzacje ka żdego z fo-tonów z osobna s ą zupe łnie przypadkowe. Zatem para foto-nów spl ą tanych ma precyzyjnie okre śloną własno ść wspóln ą (polaryzacje mierzone tak samo ustawionymi polaryzatoramisą zawsze przeciwne), natomiast stan poduk ładu, czyli poje-dynczego fotonu jest ca łkowicie nieokre ślony – wynik pomiarupolaryzacji pojedynczego fotonu jest zupe łnie przypadkowy.Spl ą tanie nie zanika wraz z odleg łością – tak przewiduje teoriakwantów (w latach 90. XX wieku eksperymentalnie udowodnio-no istnienie spl ą tania pomi ędzy fotonami odleg łymi od siebieo kilkana ście kilometrów (grupa Gisin’a, Genewa), potem za-obserwowano to zjawisko na odleg łości 144 km – na wyspachLa Palma i Teneryfa (Anton Zeilinger i wspó łpracownicy).

Poj ęcie spl ą tania zosta ło wprowadzone przez ErwinaSchroedingera w 1935 roku. Le ży ono u podstaw paradoksuEPR (Einsteina, Podolskiego i Rosena) polegaj ą cego na tym,że istnieje oddzia ływanie rozchodz ą ce si ę natychmiastowo nadowoln ą odleg łość, mimo że szczególna teoria wzgl ędno ściwyklucza przekazywanie informacji i oddzia ływa ń z pr ędko ścią większ ą od pr ędko ści świat ła. Rozumuj ą c dalej wywnioskowa-li, że zmienne kwantowe musz ą mie ć ustalon ą warto ść przed

pomiarem, co z kolei musia ło prowadzi ć do wniosku, że mecha-nika kwantowa jest teori ą niepe łną , bo nie okre śla tych ustalo-nych warto ści, a jedynie ich prawdopodobie ństwa. Wszystko todoprowadzi ło do twierdzenia Bella o niemo żliwości pogodzenia

opisu kwantowego mikro świata z opisem o charakterze kla-sycznym zgodnym z teori ą wzgl ędno ści. Stany spl ą tane jednakistniej ą i maj ą szerokie zastosowanie w informatyce kwantowej(zwłaszcza w kryptogra i i teleportacji kwantowej).

Przypomnijmy za [1, 4, 5], że rozró żnia si ę dwa g łównetypy kryptosystemów kwantowych:

– kryptosystemy z kodowaniem opartym na pomiarze

jednej z dwóch mo żliwych wielko ści reprezentowanychprzez niekomutuj ą ce (nieprzemienne) operatory hermitow-skie, tzw. protokó ł BB84 [2]), który mo żna pokrótce przedsta-wić nast ępują co ( N – nadawca, O – odbiorca):1. N losuje klucz i przesy ła go O przy losowo ustawionych

bazach polaryzatorów: prostej 0/90 lub uko śnej +45/–45stopni.

2. O za pomoca losowo ustawionych baz swoich polaryzato-rów i detektorów odbiera transmisj ę.

3. O jawnym kana łem przekazuje w jaki sposób ustawi ł swojedetektory.

4. N informuje O kana łem jawnym, w których przypadkachsię pomyli ł.

5. N i O odrzucaj ą niezgodne cz ęści klucza.6. N i O jawnym kana łem porównuj ą kilka bitów z uzyskanego

klucza. Je żeli sprawdzane fragmenty s ą zgodne odrzucaj ą je i rozpoczynaj ą transmisj ę z u życiem pozosta łej cz ęściklucza.

– kryptosystemy z kodowaniem opartym na zjawisku sta-nów spl ą tanych , tzw. protokó ł EPR. Protokó ł ten zapropo-nowany w 1991 roku przez Ekerta [3], opiera si ę na zjawiskuEPR. Najogólniej mówi ą c polega on na tym, że w generowa-nej sekwencji par spl ą tanych (czyli zwi ą zanych nierówno ścią Bella par EPR) N i O badaj ą polaryzacj ę tych par:1. Spl ą tane fotony s ą wytwarzane przez źród ło niezale żne od

N i O.2. N i O otrzymuj ą po jednym fotonie ze spl ą tanej pary.3. N poprzez pomiar polaryzacji swojego fotonu wp ływa na

stan kwantowy fotonu O.4. O dokonuje pomiaru stanu kwantowego swojego fotonu.5. Po zako ńczeniu procedury przesy łania fotonów, O posia-

da pierwotny kod (raw key) zawieraj ą cy oko ło 25% b łędówi kontaktuje si ę z N w celu porównania bramek u żytych dopolaryzacji fotonów i jej pomiaru.

6. Klucz przesiany (shifted key) sk łada si ę z ci ą gu bitów, dlaktórych bramki wybrane przez N i O by ły zgodne (oko ło50%)

Opisany algorytm mo żna zilustrowa ć nast ępują cymi schema-tami [4]:

Bezpiecze ństwo kryptosystemu kwantowego Ekerta pole-

ga przede wszystkim na tym, że informacja de niują ca kluczpojawia si ę nie podczas procesu przesy łania, lecz dopiero popomiarach dokonanych przez nadawc ę i odbiorc ę. Ka żdy po-miar jest natomiast integraln ą cz ęścią badanego uk ładu.

O protokóle Ekerta w kryptogra i kwantowejmgr in ż. ROMAN CZAJKOWSKI, dr in ż. WOJCIECH NOWAKOWSKI

Instytut Maszyn Matematycznych, Warszawa

Page 129: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 129/156

ELEKTRONIKA 3/2010 127

Rys 1. Zasada transmisji wed ług protoko łu Ekerta. Fig. 1. Example of the Ekert protocol

Rys. 2. Uzyskany kod. Fig. 2. Received code

Literatura

[1] Nowakowski W.: O kryptogra i kwantowej. Elektronika, nr 2,Warszawa 2010.

[2] Bennett C. H., Brassard G.: Quantum Cryptography: Public keydistribution and coin tossing. Proceedings of the IEEE Interna-tional Conference on Computers, Systems, and Signal Process-ing, Bangalore 1984.

[3] Ekert A.K.: Quantum cryptography based on Bell’s theorem.Phys. Rev. Lett., 1991.

[4] Borkowska A.(UMCS Lublin): Kryptogra a kwantowa, czyli prak-tyczne zastosowanie nieintuicyjnych cech realnego świata. Ref-erat wyg łoszony na V OSKNF, Wroc ław 17-19.09.2006.

[5] Tana ś R.: http://zon8.physd.amu.edu.pl/~tanas/

Page 130: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 130/156

ELEKTRONIKA 3/2010128

Dost ępne referencyjne modele procesówedukacyjnych

Systemy e-learningowe, a szerzej - systemy edukacyjne,dedykowane masowemu akademickiemu odbiorcy, dalekoodchodz ą od koncepcji technologii CBT ( Computer Based Training ), z której si ę wywodz ą pierwsze modele e-learningu,

opisane np. we wczesnych wersjach specy

kacji SCORM(Sharable Content Object Reference Model ). Pierwotne mo-dele SCORM nie uwzgl ędnia ły adaptacyjno ści prowadzeniaprocesu dydaktycznego, dostosowuj ą cego swój przebiegmniej lub bardziej inteligentnie do bie żą cego kontekstu two-rzonego przez:− dotychczasow ą histori ę kontaktów z uczestnikiem proce-

su,− pro l i preferencje uczestnika zapami ętane w systemie,− bie żą ce zachowanie uczestnika w kontakcie z przes łanymi

informacjami,− bie żą ce kompetencje uczestnika.

Standard e-learningu sprzed kilku lat, SCORM 2004 wwersji 4 edycji z 2009 r., wraz z pierwotnymi wersjami jest do-st ępny np. w [1]. Pomimo że nierozwijany jest on nadal atrak-cyjny ze wzgl ędu na zawarty w modelu silnik adaptacyjnegosekwencjonowania tre ści i nawigowania po nich oraz mecha-nizmy umo żliwiają ce budowanie bardzo z łożonych strategiitestowania, które mog ą być konstruowane nie tylko do oce-ny poziomu nabytej wiedzy, ale równie ż do „wyci ą gania” odużytkownika ró żnego typu informacji w ramach adaptacyjnieprowadzonego dialogu (nast ępne pytania lub polecenia lubporcje informacji zale że ć mog ą od poprzednio udzielonychodpowiedzi, czy zmierzonych zachowa ń lub kompetencji u żyt-kownika). Cenn ą mo żliwością w SCORM 2004 jest mecha-nizm tzw. feedbacku , czyli ró żnych form reakcji systemu nazachowania/odpowiedzi u żytkownika. Formalnie inteligentn ą dynamik ę procesów edukacyjnych, budowan ą i prowadzon ą na bazie SCORM 2004 wykorzystuje kilka modeli wbudowa-nych w jego architektur ę: Activity Tree/Clusters Model, Cur-rent Activity State Model, Tracking Model, Sequencing De ni-tion Model i Navigation Model.

Nowocze śniejsze modele procesów edukacyjnych mo żnabudowa ć i implementowa ć na bazie nowego standardu IMSCommon Cartridge (CC), obecnie opublikowanego przez IMSGlobal Learning Consortium (IMS GLC) w wersji 1.0, którywychodzi naprzeciw takim potrzebom, nieobs ługiwanym wSCORM 204, jak:− precyzyjne monitorowanie ( śledzenie) przebiegu procesu,

wynik łe z mo żliwości odnotowywania odpowiedzi (i oceny)

na ka żde pytanie (a nie tylko odnotowywania wyniku ca łe-go testu),

− włą czanie w prowadzony proces zasobów i funkcji Web2.0,

− korzystanie z ró żnorodnych źróde ł (lokalizacji) zasobówinformacyjnych,

− korzystanie z funkcji ró żnych systemów, udost ępnianych jako us ługi sieciowe zgodnie z protoko łem SOA,

− włą czanie w pakiet ( cartridge ) nie tylko tre ści (kontekstu),ale równie ż oprogramowania potrzebnego do prezentacjitre ści lub realizacji okre ślonego dzia łania w procesie, np.

testowania lub symulacji,− zapewnienie dost ępu do informacji zgodnie z potrzebami imo żliwościami (Access forAll).Pe łna dokumentacja CC dost ępna jest po zarejestrowaniu

na stronie WWW [2] oraz dla cz łonków grup roboczych IMS,w tym grupy IMS CC Alliance, której cz łonkiem by ł InstytutMaszyn Matematycznych.

Jedn ą ze s łabo ści SCORM 2004 by ły trudno ści z nawi ą za-niem wspó łpracy z tzw. oprogramowaniem trzecim lub korzy-stanie z zasobów w ró żnych lokalizacjach, czyli utrudnieniaz pe łną interoperacyjno ścią zde niowanego procesu eduka-cyjnego w kursie elektronicznym, to w CC znalaz ło w pe łnimiejsce i rozwi ą zania. CC daje nowoczesne rozwi ą zania nabudow ę i prowadzenie procesu edukacyjnego, stwarzaj ą cmo żliwości nie tylko zarz ą dzania i przetwarzania informacji,ale równie ż pozwala na zde niowanie i wykorzystanie rozpro-szonej infrastruktury wykonawczej (poprzez us ługi sieciowe ioprogramowanie wbudowane w cartridge ). CC wychodzi na-przeciw kierunkowi w rozwoju wspó łczesnych systemów infor-macyjnych – technologii mush-up , polegaj ą cej na integrowa-niu funkcji ró żnych systemów jedn ą warstw ę prezentacji (np.

jedn ą stron ą WWW).

To czego pragn ą wspó łczesne systemyinformacyjne

Potrzeba trafnego, skutecznego docierania z informacj ą (tre ścią ) do u żytkownika i odniesienia zamierzonego skutku,czy te ż osi ą gni ęcia zaplanowanych celów, nie jest wy łą czniecharakterystyczna dla systemów edukacyjnych. Skutecz-no ść ka żdego procesu informacyjnego, a szerzej ujmuj ą c,

jego wysoka efektywno ść przy uwzgl ędnieniu kosztów jestnaczelnym miernikiem przedsi ęwzięcia dla jego organizato-rów. Dzi ś , w dobie wkraczania koncepcji i technik Web 3.0(które mo żna stre ścić jako rozumne przekazywanie/udost ęp-nianie informacji z u życiem algorytmów sztucznej inteligen-cji i systemów ekspertowych oraz (inter)aktywne w łą czanieużytkownika we wspó łtworzenie online procesu informacyj-nego m.in. z wykorzystaniem technologii wirtualnej rzeczy-wisto ści) mechanizmy zapisane w modelach e-learningu

wydaj ą si ę atrakcyjne i na czasie, aby z nich korzysta ć wkonstrukcji inteligentnych, (a wi ęc) skutecznych systemówinformacyjnych z obszarów zastosowa ń innych ni ż e-lear-ning i edukacja.

Modele e-learningu w reklamie telewizyjnej …?dr in ż. JOLANTA BRZOSTEK-PAW ŁOWSKA

Instytut Maszyn Matematycznych, Warszawa

Page 131: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 131/156

ELEKTRONIKA 3/2010 129

Opis kwintesencji procesu szkoleniowego/edukacyjnegow odniesieniu do pojedynczego uczestnika, wykorzystuj ą ce-go skromny (jak na dzisiejszy poziom wymaga ń i technologii)model SCORM 2004, równie dobrze pasuje do opisu innych

procesów informacyjnych, nie wspominaj ą c o jeszcze wi ęk-szej uniwersalno ści standardu CC w innych zastosowaniachniż szkolenia i edukacja (czemu po święcony b ędzie artyku ł wnast ępnym numerze Elektroniki ).

W interaktywnym dialogu, monitorowanym i analizowanymprzez system informacyjny, uczestnik dialogu staje si ę wspó ł-twórc ą procesu informacyjnego, którym mo że by ć procesedukacyjny, inteligentnego instrukta żu, komunikacji i obs ługiklienta, marketingowy, m.in. umiej ętnie dostarczaj ą cy tre ścireklamowe i promuj ą ce produkty. Oprócz rozbudowanych me-chanizmów s łużą cych konstruowaniu interaktywnych, adapta-cyjnych procesów przekazywania (sekwencjonowania) tre ściinformacyjnych, model SCORM 2004 de niuje ró żne mo żliwo-

ści nawigowania przez u żytkownika po tre ściach - w sposóbdowolny, wynikaj ą cy z jego potrzeb lub upodoba ń, a tak że wsposób mniej lub bardziej kontrolowany przez system wed ługprzyj ętego scenariusza (dydaktyki) ich udost ępniania.

Oba mechanizmy sekwencjonowania tre ści i nawigowaniapo nich daj ą szerokie pole do konstruowania interaktywnychprocesów dostarczania zindywidualizowanych, spro lowa-nych informacji. Oprócz nich, model pozostaje otwarty (nieprecyzuj ą c, niestety, regu ł/procedur - w przeciwie ństwie doCC) na wskazywanie dodatkowych źróde ł i udost ępnianiepomocniczych b ą dź referencyjnych tre ści informacyjnych, poktóre u żytkownik mo że si ęga ć, zag łębiaj ą c si ę w spo łeczniekreowane, zgodnie z ide ą i duchem Web 2.0 zasoby informa-cyjne wiki, blogów, forów i list dyskusyjnych. Zawarte w nich:opisy, opinie, oceny i rankingi tre ści informacyjnych, narz ędzii lokalizacji ich tworzenia oraz udost ępniania, tworzone przezspo łeczno ści internetowe, maj ą wp ływ na przebieg indywidu-alnie przebiegaj ą cego procesu informacyjnego, zarówno podwzgl ędem wyboru tre ści i jej percepcji przez pojedynczegoodbiorc ę informacji, jak i pod wzgl ędem dostarczania przezsystem informacji, czy te ż nakierowywania na ni ą , podykto-wanymi analizami kierunków w opiniach i oczekiwaniach spo-łeczno ści.

Odbiorca procesu informacyjnego wspó łuczestniczy rów-nie ż w grupach spo łeczno ściowych, komunikuj ą c si ę z nimii czerpi ą c z tworzonych przez nie zasobów, jak równie ż do-starczaj ą c w łasnych tre ści. Nie oceniaj ą c stopnia wp ływu tychspo łecznych oddzia ływa ń na skuteczno ść procesu informa-cyjnego, czyli osi ą gania zamierzonego celu, warto zaznaczy ć,że dotycz ą one przede wszystkim źróde ł i tre ści dodatkowych,obok g łównego strumienia informacji przekazywanych doużytkownika. Koncentracja wysi łków twórców procesu infor-macyjnego dotyczy przede wszystkim jego skuteczno ści, np.skutecznego przeszkolenia, skutecznej pomocy merytorycz-nej, dzia łań marketingowych, a precyzyjniej efektywno ści tegoprocesu. Obok potrzeby koncentracji uwagi u żytkownika naprzekazywanych tre ściach poprzez w łą czanie go do interak-

tywnych dzia ła ń, np. do dialogu, quizów, gier, testów, symulacji,pracy grupowej z wykorzystaniem technik Web 2.0 i wirtualnejrzeczywisto ści (z obszaru technik Web 3.0), istotne obecniestaje si ę jak najwi ększe dopasowanie przekazywanych tre ści

do kontekstu, w jaki tra ają . Łą czy si ę to z potrzeb ą dobregorozpoznania kontekstu i dobrania do niego przekazywanej tre-ści. O ile istot ą Web 2.0 jest wspó łtworzenie tre ści, aktywno ść użytkowników i kooperacja w spo łeczno ści internetowej, wp ły-waj ą ce na przebieg procesów informacyjnych, to istot ą Web3.0 jest inteligencja systemów informacyjnych w rozpoznaniukontekstu, w jaki tra a informacja i predykacja jego zmianoraz monta żu (asemblacji) online w ła ściwie dobranych tre ści.Kontekst tworzy odbiorca lub grupa odbiorców, ich potrzeby,oczekiwania, preferencje i kompetencje.

Można z przesad ą powiedzie ć – tyle pro lowanych infor-macyjnych kana łów nadawczych trzeba tworzy ć, ilu mamy od-biorców. To stwierdzenie świetnie pasuje do zdiagnozowanych

potrzeb, np. telewizyjnej reklamy internetowej, opisanych wraporcie [3], do czego wrócimy w nast ępnym artykule.

Ręce na pok ład modelu IMS CommonCartridge…?

W powy ższym sformu łowaniu chodzi o r ęce (i g łowy prze-de wszystkim) projektantów systemów i procesów informa-cyjnych, w tym systemów i procesów e-learningowych. Zawcze śnie spodziewa ć si ę obecnie du żego zainteresowaniasi łą i uniwersalno ścią CC, bo jest to nowy, stale rozwijanystandard. Sprawy w tej materii zawsze tocz ą si ę ze swoist ą ,do ść znaczn ą - bo chyba kilkuletni ą inercj ą , s ą dz ą c po pro-pagacji wiedzy i do świadcze ń kilkuletniego modelu SCORM2004. Przez kilka lat, od pierwszej edycji SCORM 2004 dochwili obecnej, kolejne środowiska twórców systemów infor-macyjnych odkrywaj ą si łę SCORM 2004, przede wszystkimzawart ą w mechanizmach inteligentnego, adaptacyjnegodostarczania spro lowanej pod u ż ytkownika informacji i pro-wadzenia po niej. Przyk łady zostan ą podane w nast ępnymartykule.

Z nadziej ą mo żna przypuszcza ć, że w jeszcze wi ększymstopniu ni ż SCORM 2004 spopularyzuje si ę CC. Bo po co b łą -dzić w projekcie systemu szukaj ą c nowatorskich rozwi ą za ń,które ani nowatorskie, ani dobrze dzia łają ce okazuj ą się lepiejkorzysta ć z dopracowanych i z ewaluowanych w mi ędzyna-rodowych środowiskach modelowych rozwi ą za ń proponowa-nych przez CC. Ich implementacja na pewno b ędzie mia łacharakter innowacyjny w skali krajowej.

Literatura[1] Dokumentacja SCORM 2004 (4. edycja, 2009 r.), http://

scorm2004.net/SCORM2004_4th/ (17.02.2010 r.).[2] Informacje i dokumentacja IMS Common Cartridge http://www.

imsglobal.org/cc/alliance.html[3] Raport Two Thousand and Ten Digital Marketing Outlook. Wyd.

Society of Digital Agencies, 2010.

Page 132: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 132/156

ELEKTRONIKA 3/2010130

Today, microelectronic products have been widely used in allkinds of industries and in commonly useful household devi-ces so that the microelectronic industry has become the mostimportant human activity which acts as driving engine forscience, technology, manufacturing and overall economy. Thequality of microelectronic industry products depends on pa-ckage types, materials, fabrication and assembly processes,and environmental conditions such as moisture condensation,temperature, residual and thermal stress, ionic and organiccontamination, and electrical bias. Electronic materials arethe actual semiconductors, plastics, metals and ceramics thatmake up the chips and packages from which are constructedtoday’s cell phones, palmtops, and personal digital assistants(PDAs). The more important materials used in manufacturingof microelectronic devices and packages are silicon, copper,silver, gold, carbon, tin, lead, pure aluminum, magnesium, andtheir alloys as well as oxides, nitrides, and certain polymers..

When exposed to moisture environment containing electro-lyte solutions and under tensile stress, which may be appliedexternally or residual or thermal stresses the microelectronicelements risk of corrosion. Corrosion induced failure plays animportant role in microelectronic device and package failures.It is responsible for more than 50% of microelectronic devicedamages. There are two major corrosion types – electroche-

mical corrosion and chemical corrosion. Chemical and elec-trochemical reactions can be (and often are) coupled. Howe-ver, the vast majority of microelectronic materials dissolve viaelectrochemical reactions. The driving force for electrochemi-cal corrosion is the potential difference between anode andcathode. It is dependent on the electronic materials and suchenvironmental conditions as humidity, contaminants, tempe-rature, stress and electrical bias etc.

Corrosion in microelectronics, as in other industries, isgoverned by the electrochemical principles for aqueous cor-rosion. The environment (chemistry) and the material (manu-facturing) factors determine whether an existing device canperform its designed operations. There are, however, somecharacteristics unique to corrosion in microelectronics. The-se devices undergo corrosion damage because the two con-ditions required for a signi cant vulnerability can certainly exist:susceptible metallic materials and aggressive environments.Metals are often selected because of their electrical proper-ties, but not their resistance to corrosion. The enormous costof corrosion to microelectronic products can be signi cantlyreduced through effective corrosion testing and monitoring. Inthis paper we brie y summarize the current understanding ofcorrosion-induced degradation and its effect on the reliabilityof microelectronic devices.

Corrosion reliability of microelectronic devices.Part I: Fundamentals

(Odporno ść korozyjna urz ą dze ń mikroelektronicznych. Cz ęść 1. Podstawy)

prof. dr hab. in ż. ZDZIS ŁAW TRZASKAPolitechnika Warszawaska, Instytut Systemów Elektronicznych i Systemów Informatyczno-Pomiarowych

Fig. 1. Printed wiring devices: a) general view of a PCB, b) an Intel integrated circuit, c) oxygen-depleted titanium dioxide memristorimaged by an atomic force microscopeRys. 1. Uk ład na p łytce drukowanej: a) widok ogólny, b) uk ład scalony rmy Intel, c) obraz uzyskany za pomoc ą mikroskopu si ł ato-mowych beztlenowego memrystora wykonanego z dwutlenku tytanu

Page 133: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 133/156

ELEKTRONIKA 3/2010 131

Environment in uences on performance ofmicroelectronic devices

As information processing electronics migrated to homesand outdoor environments, an entirely new set of perfor-mance and reliability expectations were imposed on the pro-ducts. Portable electronics comprise a host of products suchas personal digital assistants, camcorders, mobile phones,external medical electronics such as hearing aids and self-

diagnostic or monitoring tools, and human-portable militaryhardware. These products are low-cost, high-volume deviceswith short product development cycle as well as product life.The used pro le is considerably diverse and variable ( Fig.1 ).Nevertheless, it is important to recognize that consumer ex-pectations of portable electronic product quality and reliabilityremain high. Portable communication and entertainment arebecoming the growth segments in the consumer electronicsindustry, and these portable electronic devices are someti-mes also viewed as fashion accessories with opportunitiesfor personalization. These devices are miniaturized, lighter,and relatively affordable at the same time. Presently the useof electronic systems is not limited to air-conditioned rooms,

but they get exposed to a variety of harsh environments. ThePrinted Circuit Boards (PCBs) in many electronic systemssuch as mobile phones could experience severe atmosphe-ric conditions depending on the place of use. Components inthe PCBs are susceptible to various types of corrosion prob-lems [1-2]. Presently the knowledge on corrosion problemsfaced by the mobile phone components is limited essentiallyto the failure analysis carried out by the manufacturing indu-stries. Almost no fundamental electrochemical data is avai-lable on how different components could interact and causecorrosion problems. Even in the military electronics domain,the human-portable military electronic hardware has to behighly exible, robust, and usable in a variety of environmen-tal conditions. In general, numerous users carry these per-sonal portable electronic devices wherever they go, and thedevices are exposed to the same environments as humans.For the above among other reasons the demand for robustand corrosion resistant electronics has increased conside-rable over the last decades ( Fig.2 ).

Not only do these products experience wide variations intemperature and humidity, they are also prone to exposure tocondensing atmospheres and a variety of hostile gaseous andparticulate contamination, particularly in urban industrial envi-ronments. These contaminations can results from the manu-facturing process, from the materials used within the packagecavity, and from leaks of the surrounding atmosphere into thepackage. The requirements for low-level contaminant identi-cation and control also become more stringent with decrea-

sing device dimensions. As a consequence, corrosion-related exposures tend tobe more prevalent in consumer and portable electronics. Inthis context, corrosion and related phenomena in portableelectronic products are extremely important to the reliableoperation of a portable consumer electronic product, andsome of the salient aspects are discussed in the followingsections.

Moreover, the microelectronic devices are subject to a mul-titude of mechanical stresses such as shock, vibration, andbend. Traditional heavy, brittle, hermetic ceramic packagesthat are prone to failure due to mechanical shock, vibration,and drop have given way to lighter, low-pro le, plastic packa-

ges, which are not hermetically sealed. Instead, the isolationfrom the environment arises from the use of primarily epoxy-based molding compounds, under lls, and so forth. A discus-sion of these mechanical aspects is considered outside thescope of this article. Therefore, although the integrated cir-cuits (ICs) in the electronic packages are relatively safe frommoisture ingress, most portable electronic appliances are notvery tolerant of environmental conditions such as condensedwater, humidity, and temperature uctuations. In addition,even low levels of corrosive substances such as chlorinatedwater can be lethal to electronic circuits. Some of the metallicmaterials that are exposed to corrosion in electronic assem-blies are: At the package level, materials such as aluminum,alloy-42, copper alloys, tin and tin-lead alloys, nickel, gold,palladium, and palladium-silver are employed in lead framematerials, pad metallurgies, lead nishes, etc. At the secondlevel assembly where the packages are assembled onto theprinted wiring board, the materials include copper, immersiontin, immersion silver, tin-lead solders, nickel, and gold. Some

Fig. 2. Identi cation of corrosion product causing high leakage current on exible interconnect to liquid crystal display (LCD)Rys. 2. Identy kacja produktów korozji powoduj ą cych up ływno ść pr ą du na elastycznym z łą czu do cieczowo-krystalicznego monitora

Page 134: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 134/156

Page 135: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 135/156

ELEKTRONIKA 3/2010 133

ckage systems provide more chances for the leakage andpermeation of moisture and corrosive gases into the insidedies, wires, bond pads, lead frames and solder joints. Forplastic encapsulated microelectronic (PEM) components, theepoxy encapsulant material is inherently permeable to mo-isture. Thus, problems with corrosion will be long-term issuesin microelectronic packages ( Fig.4 ).

Therefore, although the integrated circuits (ICs) in theelectronic packages are relatively safe from moisture ingress,

most portable electronic devices are not very tolerant of envi-ronmental conditions such as condensed water, humidity, andtemperature uctuations. Reliability problems occur when un-desired gases and vapors become of the part of the packageenvironment. The presence of moisture, chloro uorocarbons,carbon dioxides, and solvents can lead to many different fai-lure mechanisms. These contaminations can results from themanufacturing process, from the materials used within thepackage cavity, and from leaks of the surrounding atmosphe-re into the package. When a material is typically degradedby corrosion, another subsequent process causes the failure(e.g., metal thinning and mechanical overload or pitting thatcompromises hermeticity and permits intrusion of external

contaminants).

Corrosion of microelectronic materials

Corrosion processes are important in the degradation ofelectronic components. In general, corrosion can be de nedas the deterioration of a material’s properties due to its inte-raction with its environment. It is worth to mention that corro-sion is a naturally occurring phenomena that appears whena material tries to return to its natural state. It depends on pa-ckage types, materials, fabrication and assembly processes,and environmental conditions such as moisture condensation,temperature, residual and thermal stress, ionic and organiccontamination, and electrical bias. By nature of thin and close-ly-spaced metallic sections, electronic components are proneto corrosion failures even in the presence of traces of moistureand contaminants.

Atmospheric corrosion, an electrochemical process underthe in uence of thin- lm electrolytes, is primarily responsiblefor corrosion damage in electronics and can lead to prematurefailures even in indoor atmospheres ( Fig.5 ). Review of dozensof incidents and hundreds of failures in an environment high

in reduced sulfur gases (e.g., H 2S) showed the majority ofthe failures show the heaviest corrosion mainly inside the viaholes. If the via hole is not completely coated, then coppermetal is also vulnerable to atmospheric attack. The patternof attack is characterized by the appearance of ne lamentsemanating from one or more sources in semi-random direc-tions. The laments are ne tunnels composed of corrosionproducts underneath the bulged and cracked coating. Fora gold-plated contact, sul dation of the underlying copper lay-

er results in the build-up of corrosion products on the surface.The reaction is possible wherever there are pores in the Au(and Ni interlayer), exposing the Cu substrate. The chemicalreaction of the Cu with the H 2S-containing environment is thesame, regardless of the presence of the Au layer, althoughthe kinetics may certainly change due to the limited exposedCu surface area, water adsorption phenomena and possiblygalvanic effects.

The dissolution of microelectronic materials requires anoxidation of the metallic element in order to render it soluble ina liquid phase. In fact, there are four requirements for an elec-trochemical corrosion: an anode (where oxidation of the metaloccurs), a cathode (where reduction of different species oc-

curs), an electrolyte path for ionic conduction between the tworeaction sites, and an electrical path for electron conductionbetween the reaction sites. As microelectronic structures dec-rease in size, smaller amounts of dissolution on interconnectsof integrated circuits can lead to the failure of large computersystems. The corrosion specialist has a primary responsibilityto provide guidance throughout the design, construction, andlife process in terms of material selection, environment altera-tion, and life prediction.

The risk of corrosion in electronic appliances is signi canttoday due to miniaturization together with factors such as biasvoltage, globalization of production, high demands for usage,and the use of multi-material combinations. Process and ser-vice related contaminations accelerate corrosion by makingthe environment more aggressive. Due to corrosion problemslife span of the product is reduced, and failure or loss of fun-ctionality of the device leads to severe economic loss, plantdown time and customer dissatisfaction.

One of the major trends of the 21st century is the growingneed for fast and high capacity communication systems.Microelectronic devices must become more ef cient and, asa consequence, smaller in size. Additional parameters such

Fig. 4. Electrochemical cell action driven by the energy of oxidation continues the corrosion processRys. 4. Dzia łanie elektrochemicznego ogniwa pod wp ływem energii aktywacji wywo łuj ą cej process korozji

Page 136: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 136/156

Page 137: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 137/156

ELEKTRONIKA 3/2010 135

time and incorporate a speci c time-based uncertainty; η and β are Weibull distribution parameters, R is the gas constant, andE A is the activation energy. The identity function ε (def) takes onvalues of either 0 or 1 that are allocated based on an assignedprobability. To address uncertainties inherent in many materialproperties and the operating environment as a critical toolsetelement let us consider the simple case of a device containinga single wirebond that is susceptible to corrosion. For sucha device a hypothetical curve of a bond-pad resistance as

a function of time is show in Fig.7 . It can be seen that as cor-rosion proceeds the resistance increases gradually with timeand at some time, it reaches a critical value R ci , and then thedevice will no longer function as intended. A straightforwarddeterministic calculation leads to a service-life prediction in-dicated by the vertical line farthest out in time. However, ifthe uncertainty in the parameters (that always exists at somelevel in real situations) is included in the analysis, a distribu-tion of predicted resistance values can be calculated at eachtime. The tail of each distribution that is above the criticalresistance represents the probability of failure at that time

(2)

In this case, the reliability can be lowered even to 50% bythe time with respect to the deterministic service life is rea-ched. In high-reliability systems, risk of failure may becomeunacceptable when only a small tail of the distribution ex-ceeds the critical resistance (as shown in Fig.7 ). Very impor-tantly, the failure criteria for each wirebond in a device will, ingeneral, be different for each speci c type of application. The-refore, the output from the integrated corrosion model mustconsist of a time-based distribution of changes in electricalproperties (e.g., wirebond resistance values) and not a failureprobability.

Most failure mechanisms can be modeled using the Arrhe-nius empirical equation

(3)

where t tf – time to failure (hours), A – constant (hours), E A

– activation energy (eV), k – Boltzman constant, T – absolutetemperature.

Under certain engineering assumptions (e.g. constant fa-ilure rate, lack of relevant redundancies), the failure rate fora complex device is simply the sum of the individual failurerates of its components, as long as the units are consistent,e.g. failures per million hours. This permits testing of individualcomponents or subsystems, whose failure rates are then ad-ded to obtain the total system failure rate.

Since the Arrhenius equation is a physics-based model de-rived for temperature dependence, it is strongly recommendedthat the model be used for temperature accelerated tests.

Proper selection of materials and design are most effec-tive in cutting the cost of corrosion and achieving low costreliability as corrosion can be designed out of the system.It is always easier and cheaper to erase lines on a drawingthan to repair or replace failed equipment or components inservice. As integrated circuit geometries become smaller andpackage sizes and input/output counts increase, there is anincreased potential of failures resulting from moisture ingress

and corrosion.Corrosion induced failure plays an important role in micro-

electronic device and package failures. There are ve major elec-trochemical corrosion types – uniform corrosion, galvanic corro-

)(t p

Rt Pr{R pad}iof failuer Pr

i f

ci BP th

=>= })({

)/exp( kT E At Atf =

sion, microbiologically-in uenced corrosion, pitting corrosion andstress corrosion cracking. Aluminum is a very active metal andacts as anode to be corroded when coupled with another metalsuch as Al/Au in the electrolyte solutions. Metals such as alu-minum and Kovar also suffered from stress corrosion crackingwhen exposed to halide ion containing electrolyte solutions andunder tensile stress, which may be applied externally or residualor thermal stress. In order to reduce corrosion of microelectronicdevices and packages, it needs a better design for stress mana-gement, better protection of the die from, elimination of contami-nants and adding proper protective barrier layer.

Uniform corrosion or general corrosion , as sometimescalled, is de ned as a type of corrosion attack (deterioration)that is more or less uniformly distributed over the entire ex-posed surface of a metal (see illustration below). Uniformcorrosion also refers to the corrosion that proceeds at appro-ximately the same rate over the exposed metal surface. Innatural environment, oxygen is the primary cause of uniformcorrosion of metals and alloys.

Galvanic corrosion or Bimetallic corrosion or Dissi-milar metal corrosion , as sometimes called, is de ned asthe accelerated corrosion of a metal because of an electricalcontact (including physical contact) with a more noble metalor nonmetallic conductor (the cathode) in a corrosive electro-lyte. It is due to the fact that different metals and alloys havedifferent electrochemical potentials (or corrosion potentials)in the same electrolyte. The less corrosion resistant or the“active” member of the couple experiences accelerated cor-rosion while the more corrosion resistant or the “noble” mem-ber of the couple experiences reduced corrosion due to the“cathodic protection” effect. The most severe attack occursat the joint between the two dissimilar metals. Further awayfrom the bi-metallic joint, the degree of accelerated attack isreduced.

Pitting corrosion is the localized corrosion of a metal

surface con ned to a point or small area, that takes the formof cavities. Pitting is one of the most damaging forms of cor-rosion The environment (chemistry) and the material (manu-facturing) factors determine whether an existing pit can be

Fig. 7. Plot of a hypothetical change in wirebond resistance todemonstrate how the existence of uncertainty permits the prob-ability of device failure to be calculated (shaded area under thetail of the distribution)Rys. 7. Wykres przypuszczalnych zmian rezystancji po łą cz ęe ń ukazuj ą cy mo żliwo ść obliczania uszkodze ń urz ą dzenia w opar-ciu o stopie ń niepewno ści

Critical ResistanceLevel for Pad i

Reliability-basedFailure Criteria

DeterministicFailure Criteria

0

Re i

t i

p f (t i)

R BPi

Time of operation

Page 138: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 138/156

ELEKTRONIKA 3/2010136

repassivated or not. Suf cient aeration (supply of oxygen tothe reaction site) may enhance the formation of oxide at thepitting site and thus repassivate or heal the damaged passive lm (oxide) – the pit is repassivated and no pitting occurs. Anexisting pit can also be repassivated if the material containssuf cient amount of alloying elements such as Cr, Mo, Ti, W,N, etc.. These elements, particularly Mo, can signi cantly en-hance the enrichment of Cr in the oxide and thus heals or re-passivates the pit. Pitting factor is the ratio of the depth of the

deepest pit resulting from corrosion divided by the averagepenetration as calculated from weight loss.Microbiologically-in uenced corrosion (MIC) , also

known as microbial corrosion or biological corrosion , isthe deterioration of metals as a result of the metabolic acti-vity of microorganisms. There are about a dozen of bacteriaknown to cause microbiologically in uenced corrosion of alu-minum alloys and copper alloys in waters and soils with pH4~9 and temperature 10~50 oC. These bacteria can be broadlyclassi ed as aerobic (requires oxygen to become active) oranaerobic (oxygen is toxic to the bacteria).

Stress-corrosion cracking (SCC) is a cracking processthat requires the simultaneous action of a corrodent and su-

stained tensile stress. In the presence of tensile stress, cra-cking may occur along grain boundaries and can disintegra-te an alloy without applied or residual stress. ( Fig. 5 ). Stresscorrosion cracking results from the conjoint action of three

components: (i) a susceptible material; (ii) a speci c chemi-cal species (environment) and (iii) tensile stress. For example,copper and its alloys are susceptible to ammonia compounds,aluminum and its allyos are susceptible to SCC in 3.5% NaClwater solution and not in air, but stainless steels are suscep-tible to chlorides.

There is no uni ed mechanism for SCC and various mo-dels can be proposed which include the following:• Adsorption model: speci c chemical species adsorbs on

the crack surface and lowers the fracture stress.• Film rupture model: stress ruptures the passive lm locallyand sets up an active-passive cell. Newly formed passive lm is ruptured again under stress and the cycle continuesuntil failure.

• Pre-existing active path model: Pre-existing path such asgrain boundaries where intermetallics and compounds areformed.

• Embrittlement model: Hydrogen embrittlement is a majormechanism of SCC for steels and other alloys such as tita-nium. Hydrogen atoms diffuse to the crack tip and embrittlethe metal.Corrosion at low and at high temperatures is different from

that in normal ambient conditions because at low tempera-tures electrochemical process rates slow down and at hightemperature corrosive species (e. g., Cl, F, etc.) react quicklywith metallic substrate to form chlorides, uorides, etc.

Fig. 8. Images of failures in microelectronics packaging and assemblyRys. 8. Obrazy uszkodze ń mikroelektroniczych uk ładów scalonych i zespo łów

Page 139: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 139/156

ELEKTRONIKA 3/2010 137

In order to achieve reliable products, the environmentalconditions must be known. Typically, an analysis methodbased on metal samples is applied to classify the harmful-ness of a user environment, and to identify whether or nota protective coating or another corrosion preventive cautionshould be ef cient for the microelectronic appliances. To bereliable, most bi-metallic bonds require well-welded, impuri-ty-free interfaces (clean before bonding), and in addition theelectronic package should contain no ambient gasses that

corrode either metal. (e.g., no halogens in or around weldscontaining Al).

Corrosion-induced degradation of micro-electronic devicesPresently, the materials analysis requirements for microelec-tronic development and manufacturing are becoming increa-singly sophisticated with the decreasing geometries and gre-ater diversity of the materials used in each new generationof devices. As a consequence of device miniaturization, it isnecessary to characterize features of ever decreasing size,with respect to both morphology and chemistry. The internal

microstructure of materials exerts a greater in

uence on theproperties of materials with shrinking feature sizes.In general, corrosion-induce degradation of microelec-

tronic devices can lead to fatal failures such as functionalfailure, opens and shorts, and to other failures such as de-gradation of electrical characteristics and defective outerappearance which is detected as the failure in visual inspec-tion. It is worth to underline, that even low levels of corrosivesubstances such as chlorinated water can be lethal to micro-electronic assemblies and appliances.

Gold on aluminum produces a galvanic couple that canaccelerate the corrosion process by providing the driving forcefor the aluminum oxidation reaction. Bond corrosion in gold-aluminum bonds can also result from the liberation of brominefrom brominated ame retardants at high temperatures.

Copper, which is used in most printed wiring board (PWB)designs, is extremely susceptible to corrosion from chloridesand sul des. Surface corrosion can increase surface lm resi-stance and produce by-products that accelerate wear. Another

corrosion failure risk in PWBs is the reduction of insulation re-sistance between adjacent conductors. Insulation resistanceis lost by the formation of conductive bridges, and corrosionplays a signi cant role in this area. Failure under this conditionmay be attributed to dendrite growth or conductive lamentformation [1].

The metal in the wires was copper with silver overplate.Connector shells included both plastic (polyphenyl sul de) andcadmium plated or nickel-plated versions. Connection to termi-nals was done by crimping, with no ux and no soldering. Bondcorrosion may not directly result in a failure, but it can increasethe electrical bond resistance to a level that renders the devicenon-functional. Current leakage on a PCB can occur due to

a reduction in surface insulation resistance (SIR) between ad- jacent conductors. This is frequently caused by electrochemi-cal migration (ECM), which is the growth of conductive metal -laments, or dendrites, on a PCB through an electrolyte solutionunder the in uence of a DC voltage bias. Current leakage canalso result from creation of sub-surface conductive pathwaysthrough conductive lament formation ( Fig.8 ).

The microelectronic products experience wide variationsin temperature and humidity, and they are also prone to ex-posure to condensing atmospheres and a variety of hostile

Fig. 9. Images of some electronic devices that have undergone some form of corrosion during eld deploymentRys. 9. Obrazy wybranych urz ą dze ń elektronicznych, które uleg ły pewnym formom korozji podczas ich eksploatacji

Page 140: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 140/156

ELEKTRONIKA 3/2010138

gaseous and particulate contamination, particularly in urbanindustrial environments. The metallic materials such as alu-minum, alloy-42, copper alloys, tin and tin-lead alloys, nickel,gold, palladium, and palladium-silver are employed in lead fra-me materials, pad metallurgies, lead nishes, etc. which arewidely used at the package level in electronic assemblies areexposed to corrosion. Some of materials including copper, im-mersion tin, immersion silver, tin-lead solders, nickel, and goldthat that are exposed to corrosion are in use at the second

level assembly where the packages are assembled onto theprinted wiring board. To obtain maximum interconnect densitywith low via resistance requires that metal-via overlap is es-sentially zero. Zero overlap with lithographic variations andthus misalignment may result in unlanded vias. Since the viasare used to connect various metal levels, a large number ofthe corrosion cases may occur causing device failures andthus yield loss ( Fig.9 ).

Over the years, galvanic corrosion and copper oxidationare two main reliability concerns for any microelectronics pa-ckages with copper lead frame, when operating under highhumidity environment.

Intergranular or intercrystalline corrosive attack progresses

preferentially along interdendritic paths (the grain bourdaries).It results from local differences in composition, such as coringcommonly encountered in alloy castings. Positive identi ca-tion of this type of corrosion usually requires microstructureexamination under a microscopy although sometimes it is vi-sually recognizable as in the case of weld decay. Intergranularcorrosion in aluminum alloys is identi ed as exfoliation. Bondcorrosion may not directly result in a failure, but it can increasethe electrical bond resistance to a level that renders the de-vice non-functional. Particularly vulnerable are solder jointsand connectors.

In general, failures caused by corrosion of microelectronicdevices can be divided into fatal failures such as functionalfailure, opens and shorts, and other failures such as degrada-tion of electrical characteristics and defective outer appear-ance which is detected as the failure in visual inspection. Theycan be identi ed as:• Inner layer separation between laminate copper and elec-

troless copper and found Ca and S residues at failed inter-face,

• Gross electrical overstress damage by poorly fabricatedmicrovia and little or no copper plating connecting to thelayer-2 pad,

• Electrical overstress and electrostatic discharge,• Bond pad corrosion and bond wire sweep,• Dendritic growth on IC die,• Gold embrittlement,• Ball grid array solder joint failure,• Electroless-nickel immersion-gold black pad syndrome,• Delamination between plate and dielectric,• Electromigration path created by void bridges plates,• Electrical leakage failures.

It is worth mentioning that when a material is typically de-graded by corrosion, another subsequent process, e.g. metalthinning and mechanical overload or pitting that compromiseshermeticity and permits intrusion of external contaminantscauses the failure, causes the failure.

Many materials, including polymers, used in microelectro-nic applications do not adhere well to gold. Gaps can formnear the bond between the gold wire and the circuit thin lm

metallization. In the case when the thin lm metallization isdifferent from gold, for instance, dissimilar metals are in conta-ct, then a built-in potential develops across the gold wire–thin lm metal interface. Thus, electrolytic corrosion can occur if

suf cient surface leakage i.e. corrosion current resulting fromionic motion is present, even in the absence of an externallyapplied potential. For other dissimilar metal joints similar effe-cts can occur. Moreover, dissimilar metal interfaces can alsoresult from the precipitation of an alloying element in a parti-cular thin lm metallization system.

Speci c type of failure mechanism is associated with nob-le metals such as silver and gold involving the formation ofmetal bridges between two metal lines at different potentials.

However, in principle this type of failure mechanism couldhappen in less noble metal systems especially if complexingions are present. Another possible corrosion-initiated failureis related to decreases in line width. The loss of interconnec-tion cross-sectional area leads to an increased local currentdensity.

The above presented corrosion-induced degradations ofmicroelectronic devices and their effects on the reliability ofmicroelectronic industry products remain as technologicallyimportant problems, including the functional form and ttingparameters of the acceleration functions.

Conclusions

Corrosion-induced failure in microelectronic devices, inclu-ding the fundamentals of corrosion and packaging in uencesare presented in this rst part of the paper. Electrochemicalcorrosion processes in microelectronic devices proceed ata rate that is determined by the electrochemical kinetics atthe corroding metal or by the rate of charge transfer betweenthe two electrodes. The general mechanisms responsible forcorrosion-induced failures, including those related to dielec-tric degradation, are discussed. Speci c circuit models andresults of performed experiments focused on microcrystallinethin layers manufactured from copper and aluminum basedalloys as well as their composites will be presented in the se-cond part of the paper [34].

References

[1] Marcus Ph.: Corrosion Mechanism in Theory and Practice. (2 nd ed.), CRC Press, New York, 2002.

[2] Kelly R.G., Scully J.R., Shoesmith D.W., Buchheit R.G.: Elec-trochemical Techniques in Corrosion Science and Engineering.Marcel Decker AG, Basel, 2004.

[3] Perez N.: Electrochemistry and Corrosion Science. Kluwer Aca-demic Publisher, Basel, 2004.

[4] Schweitzer Ph. A.: Encyclopedia of Corrosion technology, 2 nd ed.revised and expanded. Marcel Decker AG, Basel, 2004.

[5] Roberge P.R.: Handbook of Corrosion Engineering. McGraw-HillCompanies, Inc., New York, 2000.

[6] Harper Ch. A.: Integrated Circuit, Hybrid and Multichip ModulePackage Design Guidelines: A Focus on Reliability ElectronicMaterials and Processes Handbook. McGraw-Hill, new York,2005.

[7] Viswanadham P.: Corrosion and Related Phenomena in PortableElectronic Assemblies. ASM, Nokia Research Center, SridharCanumalla, 2006.

[8] Hillman C.: A Novel Approach to Identifying and Validating Elec-trical Leakage in Printed Circuit Boards through Magnetic Cur-rent Imaging. University of Maryland, 2004.

[9] Trzaska M., Trzaska Z.: Electrochemical Impedance Spectrosco-py in Materials Science, (in Polish). Publishing Of ce of WarsawUniversity of Technology, Warsaw, 2010 (in print).

[10] Tan C. W., Daud A. R., Yarmo M. A.: Corrosion study at Cu–Al in-terface in microelectronics packaging. Applied Surface Science,vol 191, no. 1-4 , 2002, pp. 67-73.

[11] Datta M., Osaka T., Schultze W.: Microelectronic packaging.CRC Press, Boca Raton, 2005.[12] Hillman C., Castillo B., Pecht M.: Diffusion and absorption of cor-

rosive gases in electronic encapsulants. Microelectronics Reli-ability, vol. 43, no. 4 , 2003, pp. 635-643.

Page 141: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 141/156

Page 142: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 142/156

ELEKTRONIKA 3/2010140

Rys. 1. Schemat blokowy odbiornika z uk ładem FPGAFig. 1. Block diagram of the receiver with the FPGA structure

Rys. 2. Schemat funkcjonalny uk ładu regulacji poziomu modulacjiFig. 2. Block diagram of the setup and adjustment of the modulation level

Rys. 3. Schemat blokowy wzmacniacza pomiarowegoFig. 3. Block diagram of the measuring ampli er

cję sprz ę tu komputerowego – konieczn ą na skutek nieustanne-go post ę pu technologicznego. Dodatkowo, w obu powy ższychrozwi ą zaniach jest niezb ę dny zewn ę trzny wzmacniacz mocy,zasilaj ą cy cewki modulacyjne. Uznano wi ę c, że jest celoweopracowanie specjalizowanego, cyfrowego odbiornika – nada-

ją cego si ę zarówno do budowy nowego spektrometru EPR jakte ż do modernizacji spektrometrów starszego typu.

Pierwsz ą wersj ę cyfrowego odbiornika sygna łu EPR nazakres cz ę stotliwo ś ci 1…100 kHz opracowano wspólnie z r-

mą „ASONIK” z Tuczna k/Poznania. W odbiorniku tym, op-artym na mikroprocesorze PIC16F877 (Microchip) zamiastcyfrowej detekcji synchronicznej zastosowano tzw. akumu-lacj ę koherentn ą . Polega ona na tym, że w jednym okresie

specjalizowanego, cyfrowego detektora synchronicznego, wy-konanego w postaci specjalnej karty do komputera PC [2, 3].Rozwi ą zanie z przyrz ą dem SR810/830 uznano jednak jakozbyt nadmiarowe i stosunkowo kosztowne, poniewa ż jegoróżne rozbudowane funkcje (wynikaj ą ce z zamierzonej, du żejuniwersalno ś ci przyrz ą du) staj ą się w spektrometrze raczej nie-przydatne, a niektóre wr ę cz niekorzystne. Natomiast wykonanyw technice dyskretnej (rozwi ą zanie takie zapewnia du żą szyb-kość dzia łania – wi ę ksz ą od uzyskiwanej w popularnych proce-

sorach sygna łowych) synchroniczny detektor Kamasy wyma-ga obecno ś ci starego, analogowego odbiornika sygna łu EPR.Wad ą tego rozwi ą zania jest równie ż konieczno ść umieszczaniadodatkowej karty w komputerze, co bardzo utrudnia moderniza-

Page 143: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 143/156

ELEKTRONIKA 3/2010 141

sygna łu o cz ęstotliwo ści moduluj ą cej jest pobierana jednapróbka sygna łu EPR (zastosowano 12 bitowy przetwornik A/Ctypu AD9223) – próbki z N okresów s ą sumowane i nast ępniepoddawane ltracji dolno-przepustowej (zastosowano rekur-sywny ltr cyfrowy pierwszego rz ędu). Oczywi ście, momentpobierania próbki jest dobierany w celu uzyskania maksymal-nej warto ści odbieranego sygna łu EPR [4].

W nast ępnej wersji odbiornika (dla cz ęstotliwo ści 1 kHz)zastosowano cyfrow ą detekcj ę synchroniczn ą , w której w jed-

nym okresie sygna łu moduluj ą cego jest pobieranych 16 pró-bek sygna łu EPR. Próbki te s ą mno żone przez cyfrow ą funkcj ę odniesienia, a wyniki tych mno żeń z N okresów s ą ze sob ą su-mowane i nast ępnie poddawane cyfrowej ltracji dolno-prze-pustowej – podobnie jak w poprzednim przypadku zastoso-wano rekursywny ltr pierwszego rz ędu [5]. Cyfrowa obróbkasygna łu jest realizowana za pomoc ą procesora 80C517A, dorejestracji sygna łu wykorzystano wbudowany w procesor sto-sunkowo szybki, 10-bitowy przetwornik A/C. Badaj ą c obie wer-sje odbiornika stwierdzono, że cyfrowa detekcja synchroniczna

jest bardziej korzystna od akumulacji koherentnej – szczegól-nie w przypadku ma łej cz ęstotliwo ści modulacji.

W nast ępnej, ulepszonej wersji odbiornika (dla cz ęstotliwo ści

100 kHz) w cz ęści cyfrowej obróbki sygna łu zastosowano mikro-procesory typu RISC (ATMega16 dla detekcji synchronicznej oraz ATMega8 do wytwarzania synchronicznego sygna łu odniesie-nia), szybki (3 MHz), 12 bitowy, szybki przetwornik A/C (AD9223)oraz dodatkow ą pami ęć po średni ą SRAM (do przechowywaniapróbek i cz ęściowych oblicze ń). Obie ostatnie wersje odbiornikawykorzystano do modernizacji kilku spektrometrów EPR oraz dobudowy 2-kana łowego spektrometru EPR [6-9].

W ramach projektu rozwojowego Narodowego CentrumBada ń i Rozwoju Nr N R01 0018 04 pt. „Prototyp spek-trometru EPR do bada ń dozymetrycznych i identy kacjinapromieniowanej żywno ści” opracowano zupe łnie now ą wersj ę cyfrowego odbiornika sygna łu EPR. W porównaniuz poprzednimi rozwi ą zaniami, w cz ęści cyfrowej obróbki sygna-łu zastosowano nowoczesny uk ład programowalny typu FPGA,posiadaj ą cy znacznie wi ększe mo żliwości w porównaniu z mi-kroprocesorem 1-uk ładowym.

Cyfrowy odbiornik z uk ładem FPGA [9]

Schemat blokowy opracowanego odbiornika z uk ładem FPGA jest przedstawiony na rys. 1. W sk ład nowej, opracowanejwersji odbiornika wchodz ą :

– programowany wzmacniacz mocy, steruj ą cy cewki modu-lacyjne pr ą dem zmiennym oraz cyfrowy generator sinuso-idalnego sygna łu odniesienia (modulacji) o cz ęstotliwo ści100 lub 1 kHz ( rys. 2 ),

– programowany, selektywny wzmacniacz sygna łu EPR,na którego wyj ście jest pod łą czone znajduje si ę szybki(6,4 MHz), 14-bitowy przetwornik A/C ( rys. 3 ),

– uk ład cyfrowej obróbki sygna łu z uk ładem FPGA (wykorzy-stano tutaj minimodu ł serii MMfpga z uk ładem typu Spar-tan3 S200, oferowany przez rmę PROPOX), realizuj ą cyproces cyfrowej detekcji synchronicznej (wraz z u średnia-niem) oraz proces cyfrowej ltracji sygna łu EPR,

– centralny procesor steruj ą cy z mikroprocesorem 80C517Ai ekranem gra cznym 192x64, zintegrowanym z klawiatur ą .W opracowanym odbiorniku wprowadzono tzw. tryb serwi-

sowy, w którym s ą ustawiane pewne, „fabryczne” parametry,zwią zane z danym egzemplarzem rezonatora ( łą cznie przewi-

dziano stosowanie 4 ró żnych rezonatorów): – zestaw kondensatorów, które wraz z cewkami modulacyj-

nymi rezonatora zapewniaj ą rezonans szeregowy dla cz ę-stotliwo ści modulacji, równej 100 kHz (kondensatory te s ą

włą czane zestawem przeka źników). Przy braku rezonansumo że wyst ą pić przesterowanie wzmacniacza mocy, zasi-lają cego cewki modulacyjne,

– warto ść amplitudy napi ęcia wyj ściowego generatora syg-na łu moduluj ą cego, zapewniaj ą ca wymagany poziom mo-dulacji pola magnetycznego w rezonatorze pomiarowym(przetwornik MPAC-1 na rys. 2 ).Ustawione warto ści s ą umieszczane w pami ęci EEPROM

i s ą wprowadzane do systemu po w łą czeniu zasilania. Tryb

serwisowy nie jest dost ępny dla u żytkownika.

Modu ł DSP na uk ładzie FPGA

W opracowanej nowej wersji odbiornika, szczególn ą uwag ę zwrócono na modu ł cyfrowej obróbki sygna łu. Schemat bloko-wy modu łu cyfrowej obróbki sygna łu (DSP) wraz z generatoremsygna łu modulacji 100 kHz (lub 1 kHz) jest przedstawiony narys. 4 , natomiast na rys. 5 jest przedstawiono schemat blokowyalgorytmu dzia łania modu łu DSP i generatora. Wymiana infor-macji pomi ędzy tymi modu łami a procesorem centralnym odby-wa si ę poprzez izolowane łą cza SPI oraz RS-232. W uk ładziemo żna wyró żnić modu ł generatora sygna łu modulacji (b ędą ce-

go sygna łem odniesienia) oraz modu ł DSP, realizuj ą cy cyfrow ą obróbk ę sygna łu wraz z formowaniem sygna łu wyj ściowego.

Modu ł GeneratoraW sk ład modu łu generatora wchodzi 14-bitowy przetwornikC/A (AD9754), wytwarzaj ą cy przebieg sinusoidalny o cz ęsto-tliwości 100 lub 1 kHz, którego okres sk łada si ę z 64. próbekpobieranych z pami ęci look-up-table . Przebieg ten jest poda-wany poprzez uk ład regulacji poziomu modulacji na wzmac-niacz mocy i dalej poprzez uk ład dopasowuj ą cy do cewekmodulacyjnych rezonatora pomiarowego.

Modu ł DSPW sk ład modu łu DSP wchodz ą : 14-bitowy przetwornik A/C(AD9240), blok cyfrowej detekcji synchronicznej wraz z u śred-nianiem, blok cyfrowej ltracji wraz z cyfrowym wzmocnieniemoraz blok wyprowadzania sygna łu EPR w postaci analogowej

– z przetwornikiem C/A (AD8300) oraz z postaci cyfrowejpoprzez łą cze SPI, wbudowane w CPU. Sygna ł z wyj ściawzmacniacza odbiorczego jest podawany na wej ście prze-twornika A/C, sterowanego synchronicznie z przetwornikiemC/A, wytwarzaj ą cym sygna ł moduluj ą cy. Przy cz ęstotliwo ścisterowania przetwornika A/C, równej 6,4 MHz, s ą pobierane64 próbki sygna łu o cz ęstotliwo ści 100 kHz. Próbki te wrazz ich kolejnym numerem (adresem) s ą nast ępnie poddawanetzw. cyfrowej detekcji synchronicznej , polegaj ą cej na specjal-nym mno żeniu przez siebie dwóch liczbowych ci ą gów i u śred-nianiu wyniku.

Zarejestrowany ci ą g liczbowy próbek jest podawany nawej ście X uk ładu mno żą cego X-Y, na którego wej ście Y jestpodawany drugi ci ą g liczbowy, b ędą cy warto ściami liczbo-wymi funkcji sinus , odleg łymi od siebie o 1/64 okresu. Obacią gi s ą wzgl ędem siebie przesuni ęte o warto ść przesuni ęciafazowego, zadawanego centralnym procesorem steruj ą cym.Wyniki kolejnych mno że ń próbek przez odpowiadaj ą ce imwarto ści funkcji sinus s ą sumowane i umieszczone w akumu-latorze 64-bitowym (podczas operacji mno żenia i sumowaniaodbywa si ę rejestracja nast ępnych próbek sygna łu). W zale ż-no ści od zadanego przesuni ęcia fazowego otrzymany wynikmo że by ć dodatni, ujemny lub te ż zerowy – jest to wi ęc proceskoherentny, w którym wynik zale ży od przesuni ęcia fazowegopomi ędzy sygna łem a funkcj ą odniesienia. Liczba okresów,w czasie których s ą pobierane i sumowane próbki zale ży od

Page 144: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 144/156

ELEKTRONIKA 3/2010142

cz ęstotliwo ści sygna łu oraz od zadanej sta łej czasowej dol-noprzepustowego, cyfrowego ltru wyj ściowego. Dla sta łejczasowej ustawianej w zakresie od 10 ms do 30 s ilo ść sumo-wanych okresów wynosi od 128 do 16384 dla cz ęstotliwo ści100 kHz.. Mo żna wykaza ć, że dzi ęki koherentnemu sumowa-niu próbek z m okresów uzyskuje si ę (niezale żnie od warto ścicz ęstotliwo ści granicznej ltru wyj ściowego) popraw ę stosun-ku sygna ł/szum równ ą √m. Otrzymana w wyniku sumowaniaprzez m okresów próbka sygna łu jest poddawana procesowi

cyfrowej ltracji dolnoprzepustowej. Dolnoprzepustowy, rekur-sywny ltr cyfrowy II rz ędu jest realizowany jako kaskadowepo łą czenie dwóch ltrów I rz ędu, opisanych algorytmem:

(1)

gdzie: y (n) i x (n) – odpowiednio aktualna próbka wyj ściowai wej ściowa, y (n-1 ) – poprzednia próbka wyj ściowa, α < 1 –wspó łczynnik wyznaczony przez porównanie ltru cyfrowego(1) z dolnoprzepustowym ltrem RC.

Równanie ró żniczkowe ltru dolnoprzepustowego pierw-szego rz ędu jest nast ępują ce:

(2)

gdzie: u x (t ) – napi ęcie wej ściowe, u y (t ) – napi ęcie wyj ściowe,τ – sta ła czasu).

Zast ępuj ą c w wyra żeniu (2) czas ci ą gły t czasem dyskret-nym, sk ładaj ą cym si ę z n elementarnych odcinków t s czylit = n t s i stosuj ą c uproszczony zapis:

u y(n · t s) = y(n) oraz u x(n · t s) = x(n),

otrzymuje si ę równanie ró żnicowe:

(3)

oraz dalej:

(4)

St ą d otrzymuje si ę: (5)

W rozwa żanym przypadku odcinek czasu t s wynika z liczbyokresów, w czasie których s ą pobierane i sumowane prób-ki sygna łu wej ściowego. Dla uproszczenia oblicze ń odcinkit s przyj ęto takie, aby wspó łczynnik α by ł równy 1/2, 1/4, 1/8,1/16, 1/32, 1/64......- w technice cyfrowej mno żenie lub dziele-nie przez 2 n odpowiada przesuni ęciu ca łego s łowa o n-bitóww lewo lub w prawo.

Wzmocnienie cyfrowe oraz przesuni ęciesk ładowej sta łej

Wzmocnienie ca łego toru odbiorczego jest regulowane w za-kresie 1x10 2 – 5x10 6 i jest roz łożone na cz ęść analogow ą i cyfrow ą , przy czym stopie ń tego rozk ładu zale ży g łównieod rozdzielczo ści przetwornika A/C, obecnego na wyj ściuwzmacniacza. S ą tutaj nast ępują ce ograniczenia:

– nie powinno wyst ępowa ć przesterowanie wzmacniacza. Wy-

nika st ą d maksymalne wzmocnienie w cz ęści analogowej, – poziom sygna łu u żytecznego powinien by ć większy od

rozdzielczo ści przetwornika A/C. Wynika st ą d minimalnewzmocnienie analogowe.

( ) ( ) (1 ) ( 1) ( 1) [ ( ) ( 1)] y n x n y n y n x n y nα α α= + − − = − + − −

( ) 1 1( ) ( )

y y x

du t u t u t dt τ τ+ =

1 1( ) ( )

( ) ( 1)

s

y n x n y n y n

t τ τ+ =− −

( )( ) ( 1)

1 1

s

s s

t x n y n y n

t t

τ

τ τ= + −+ +

α = 1/ (1+ τ /t s) oraz τ /t s = (1 - α) / α

Page 145: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 145/156

ELEKTRONIKA 3/2010 143

Rys. 5. Schemat blokowy algorytmu dzia łania modu łu DSP i generatora sygna łu moduluj ą cego

Fig. 5. Block diagram of the algorithm of the DSP module work

Rys. 4. Schemat blokowy modu łu DSP i generatora sygna łu moduluj ą cegoFig. 4. Block diagram of the DSP module and of the modulating signal generator

Jak ju ż zaznaczono, w module DSP wszystkie procedurycyfrowe s ą realizowane na s łowie 64-bitowym, podczas gdyna wyj ście jest przekazywane s łowo 12-bitowe, podawanedalej na przetwornik C/A (AD8300) oraz bezpo średnio nawyjście cyfrowe SPI – pod łą czone do centralnego procesora.Wzmocnienie cyfrowe równe k = 2 n otrzymuje si ę w przypad-ku, gdy najstarszy bit s łowa 12-bitowego b ędzie n – tym bitemliczonym w prawo od najstarszego bitu s łowa 64-bitowego.Musi by ć tutaj spe łniony warunek, że bity starsze od bitu nmusz ą by ć równe zero – w przeciwnym przypadku wyst ą pitzw. przesterowanie cyfrowe.

W opracowanym odbiorniku przyj ęto nast ępują cy rozdzia ł wzmocnie ń: dla zakresów 1x10 2 – 5x10 4 wzmocnienie jestregulowane tylko w cz ęści analogowej przy wzmocnieniu cy-frowym równym 16, natomiast dla zakresów 1x10 5 – 5x10 6

wzmocnienie jest regulowane tylko w sposób cyfrowy w za-kresie od x32, x64 do x1024 i korygowane w cz ęści analogo-wej dla uzyskania podzia łu x2.5, x5, x10.

Dodaj ą c (lub odejmuj ą c) do 64-bitowego s łowa dodatkow ą liczb ę binarn ą otrzymuje si ę tzw. przesuni ęcie sk ładowej sta-łej. Procedura ta umo żliwia eliminacj ę niepo żą danego sygna łu,tzw. t ła, wywo łanego np. szumami lub innymi sygna łami zak łó-caj ą cymi. Oczywi ście, przy zbyt du żym przesuni ęciu sk łado-wej sta łej mo że wyst ą pić przesterowanie w cz ęści cyfrowej.

Podstawow ą korzy ścią , wynikaj ą cą z zastosowania uk ładuFPGA w module DSP odbiornika jest znacznie szybsza jego

praca, a tym samym mo żliwość stosowania bardziej zaawan-sowanych technik obliczeniowych. W porównaniu z mikropro-cesorem 1-uk ładowym, czy te ż procesorem typu DSP, wyko-nują cym w tym samym czasie tylko jedn ą instrukcj ę, uk ład

Page 146: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 146/156

ELEKTRONIKA 3/2010144

Rys. 6. Widok od przodu cyfrowego odbiornika sygna łu EPRFig. 6. Front view of the EPR signal digital receiver

FPGA umo żliwia budow ę uk ładu cyfrowego, sk ładaj ą cego si ę z wielu oddzielnych, pracuj ą cych równolegle cyfrowych mo-du łów obliczeniowych. Umo żliwia to równoleg łe wykonywaniewielu ró żnych operacji w tym samym czasie, co znakomicieprzy śpiesza prac ę ca łego urz ą dzenia.

Podsumowanie

Najwa żniejsze parametry odbiornika:

● Modulator Cz ęstotliwo ść pracy 100 kHz (1 kHz – opcja),

Amplituda modulacji 0,12 μT – 1 mT ustawiana z krokiem 2 dB.

● Odbiornik Wzmocnienie 10 2 – 5·10 6 ustawiane w sekwencji x2,5; x5 i x10,Sta ła czasowa ltru wyj ściowego 30 ms – 30 s ustawianaw sekwencji x3, x10,Zakres regulacji fazy 0 – 360 o z rozdzielczo ścią 1 o,Przesuw sk ładowej sta łej 0 -+/- 125% – zakresu,

Wyjście analogowe/cyfrowe 0 – +/- 1,0 V/12 bitów, poziom TTL,Pole odczytowe gra czne LCD, 192x64, pod świetlane,Sterowanie lokalne/zdalne klawiatura/USB.

● OgólneZasilanie 220 – 240 V, 50 Hz, 50 VA,Wymiary zewn ętrzne 485x155x470 mm (panel S-19),

Widok od przodu opracowanego odbiornika jest przedsta-wiony na rys. 6.

Jak ju ż wcze śniej zaznaczono, przedstawiona wersja cy-frowego odbiornika sygna łu EPR zosta ła opracowana w ra-mach projektu rozwojowego NCBiR Nr: N R01 0018 04 pt.„Prototyp spektrometru EPR do bada ń dozymetrycznychi identy kacji napromieniowanej żywno ś ci” . Chocia ż opracowany prototyp spektrometru EPR pracuje w mikrofa-lowym pa śmie L (1 GHz), to opracowany odbiornik, wyposa-żony w zaawansowan ą technik ę cyfrowej obróbki sygna łu,nadaje si ę zarówno do budowy nowego spektrometru EPR(pracuj ą cego praktycznie w dowolnym pa śmie), jak te ż domodernizacji spektrometrów EPR starszego typu. Dodatko-

wo, stosuj ą c dwa takie odbiorniki, Np. o cz ęstotliwo ści 100oraz 1 kHz, mo żna zbudowa ć tzw. 2-kana łowy spektrometrEPR, umo żliwiają cy pomiary ilo ściowe wzgl ędem wzorca[8]. Spektrometr o takich mo żliwościach nie jest oferowanyprzez światowy przemys ł aparaturowy.

Praca nansowana w ramach projektu rozwojowego NCBiR Nr:N R01 0018 04

Literatura

[1] Stankowski J., Hilczer W.: Wst ęp do spektroskopii rezonansówmagnetycznych. Wydawnictwo Naukowe PWN 2005.

[2] Duchiewicz J., Dobrucki A.,Sadowski A., Kamasa P.: Zas-tosowanie cyfrowej detekcji synchronicznej (DPSD) do odbi-oru sygna łów EPR. XXX Ogólnopolskie seminarium na tematMagnetycznego Rezonansu J ą drowego i jego zastosowa ń, IFJ,Kraków, grudzie ń 1997.

[3] Duchiewicz J., Kamasa P.: Digital Phase Sensitive Detector Us-ing Gabor Transform. XXX Ogólnopolskie seminarium na tematMagnetycznego Rezonansu J ą drowego i jego zastosowa ń, IFJ,Kraków, grudzie ń 1997.

[4] Duchiewicz J., Dobrucki A., B łaszczyk J.: Odbiornik z cyfrow ą detekcj ą synchroniczn ą do spektrometru EPR, Elektronika, Nr 1,2001.

[5] Duchiewicz J., Dobrucki A.: Cyfrowy odbiornik do spektrometruEPR, Elektronizacja, Nr 8, 2005.

[6] Duchiewicz J., Dobrucki A., Sadowski A.: Technika cyfrowejdetekcji synchronicznej w odbiorze s łabych sygna łów. KrajowaKonferencja Elektroniki, KKE’ 2002, Politechnika Koszali ńska,Wydzia ł Elektroniki, D źwirzyno, czerwiec 2002.

[7] Duchiewicz J., Dobrucki A., Duchiewicz T., Sadowski A.:Modu łowy Spektrometr EPR na pasmo Q. Elektronika – kon-strukcje, technologie, zastosowania, nr 6/2006.

[8] Duchiewicz J., Dobrucki A., Francik A., Gutsze A., Liber A.:Spektrometr Elektronowego Rezonansu Paramagnetycznegona pasmo X, umo żliwiają cy jednoczesn ą rejestracj ę sygna łówdwóch próbek. Elektronizacja nr 6/2003.

[9] Duchiewicz J., Dobrucki A., Francik A., Sadowski A., Liber A.:Spektrometr elektronowego rezonansu paramagnetycznego(EPR) – kupi ć nowy, czy modernizowa ć stary?. Elektronizacja,nr 9/2003.

[10] Duchiewicz J., Dobrucki A., Francik A., Duchiewicz T., Sad-owski A., Id źkowski B.: Cyfrowy odbiornik z uk ładem FPGA doSpektrometru Elektronowego Rezonansu Paramagnetycznego(EPR). Raporty Politechniki Wroc ławskiej, I-28/10/S-011.

Page 147: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 147/156

ELEKTRONIKA 3/2010 145

W elektronice wysokich częstotliwości, dużych mocy i wyso-kich temperatur konieczne jest wykorzystywanie takich mate-riałów półprzewodnikowych, które cechuje m.in. wytrzymałość na dzia łanie dużego nat ężenia pola elektromagnetycznego,szeroka przerwa energetyczna, du ża ruchliwość nośnikóworaz wysokie przewodnictwo cieplne. Największe możliwo-ści aplikacyjne w przyrzą dach wysokiej częstotliwości i dużejmocy dostarcza w ęglik krzemu (SiC) oraz azotek galu (GaN)i jego zwią zki.

Szczególne zainteresowanie budz ą przyrzą dy o wielkich

i wciąż nie do końca wykorzystywanych możliwościach, czylitranzystory typu HEMT (z ang. High Electron Mobility Transi-stor ), których działanie opiera si ę na wytworzeniu i wykorzy-staniu dwuwymiarowego gazu elektronowego o wysokiej ru-chliwości nośników, powstają cym w heterozłą czu AlGaN/GaN(rys. 1 ).

Tranzystory HEMT, wytwarzane na heterostrukturach AlGaN/GaN znajdują zastosowanie w tak powszechnychdzisiaj urzą dzeniach telekomunikacji bezprzewodowej (np.:Wi-Fi, GSM), nowoczesnych urzą dzeniach dla monitorowa-nia i ochrony środowiska (np.: biosensory), systemów bez-pieczeństwa, również do walki z terroryzmem (generatoryi detektory promieniowania terahercowego), a tak że w nowo-czesnych systemach nawigacji, w szczególno ści w systemachradarowych.

Heterostruktury stanowią ce aktywną część tranzystorówHEMT wytwarza się głównie metodą epitaksji ze zwią zkówmetaloorganicznych w fazie pary w obniżonym ciśnieniu LP

Heterostruktury AlGaN/AlN/GaN na pod ło żach4H-SiC uzyskane metod ą LP MOVPE do zastosowa ń

w technologii tranzystorów HEMTmgr PIOTR CABAN 1,2 , dr in ż. W ŁODZIMIERZ STRUPI ŃSKI 1, prof. dr hab. JAN SZMIDT 2

1Instytut Technologii Materiałów Elektronicznych, Warszawa2 Politechnika Warszawska, Instytut Mikroelektroniki i Optoelektroniki

MOVPE (ang. – Low Pressure Metal-Organic Vapour PhaseEpitaxy ). Struktury takie można z powodzeniem osadza ć napodłożach z sza ru (Al2O3) oraz krzemu (Si). Jednak powa ż-nym problemem przy epitaksji na tych pod łożach jest du żeniedopasowanie sta łych sieci pomiędzy GaN i kryształempodłożowym (dla szaru – 13,4%, krzemu -16%). Obecnienajlepszym pod łożem do epitaksji GaN jest w ęglik krzemuz niedopasowaniem ok. 3,4% (oczywi ście oprócz samego ob-

jętościowego azotku galu, który jest jeszcze do ść kosztownyi nie wykorzystywany na skalę przemys łową ). Właściwości SiC

są lepsze niż innych półprzewodników. Mała różnica warto-ści współczynnika rozszerzalno ści cieplnej między węglikiemkrzemu i azotkiem galu oraz bardzo wysokie przewodnictwocieplne klasykuje go jako najlepszy materia ł podłożowy doepitaksji GaN w przyrzą dach wysokiej mocy o podwyższonejtemperaturze pracy i wytrzyma łości na działanie dużego nat ę-żenia pola elektromagnetycznego.

W przedstawionej pracy zaprezentowano wyniki bada ń nad wzrostem azotku galu oraz struktur epitaksjalnych AlGaN/GaN na pod łożach z węglika krzemu metodą LP MOVPE.Uzyskane rezultaty umo żliwiły opracowanie kompletnej tech-nologii wytwarzania struktur, której jakość oraz użyteczność zwerykowano poprzez wykonanie i charakteryzacj ę przyrzą -dów tranzystorów HEMT, jako demonstratorów werykują cych

jakość tej technologii.

Wybrane problemy epitaksji MOVPE azotku galu naw ę gliku krzemu

Technologia osadzania GaN na pod łożach z SiC jest rozwi- jana na świecie od lat 90. ubieg łego wieku, jednakże mimowielu publikacji naukowych dotyczą cych tego tematu, nieujawnia się w nich wielu istotnych szczegó łów technolo-gicznych. Opanowanie technologii osadzania azotku galuna pod łożach z węglika krzemu wymagało rozwią zaniawielu problemów. Mimo faktu,że sta łe sieci a komórki ele-mentarnej GaN i SiC ró żnią się tylko o ok. 3,4% w porów-naniu do układu GaN – sza r – 13,4%, a warto ści współ-czynników rozszerzalności liniowej są do siebie zbliżone, toepitaksja GaN na SiC jest utrudniona ze wzgl ędu na s łabą zwilżalność powierzchni węglika krzemu przez atomy galu.Oczywiście możliwe jest uzyskanie wzrostu GaN sposo-bem stosowanym przy osadzaniu azotku galu na sza rzeczyli przez zastosowanie cienkiej, amor cznej warstwy nu-kleacyjnej z azotku galu, osadzanej w niskiej temperatu-rze, która wygrzewana w atmosferze wodoru, b ą dź azotu,ulega rekrystalizacji i stanowi bazę do dalszego osadzeniawarstwy. Jednak jedna z najistotniejszych wad tej metody(zarówno dla pod łoży z Al2O3 oraz z SiC) to generowanieróżnego typu dyslokacji w osadzanym materiale, oraz prob-lemy z odwróceniem polarno ści GaN z polarności galowejna azotowa, która nie jest po żą dana ze wzgl ędu na bardzodużą chropowatość powierzchni. Rozwią zaniem problemuzwilżalności powierzchni podłoży SiC jest zastosowanie in-nego materia łu z grupy III układu okresowego pierwiastków,

Rys. 1. Struktura pasmowa heterostruktury AlGaN/AlN/GaN z za-znaczonym pasmem przewodnictwa E C , walencyjnym E V i pozio-

mem Fermiego E F oraz umiejscowieniem dwuwymiarowego gazuelektronowego 2DEGFig. 1. The band structure of AlGaN/AlN/GaN heterostructure withthe conduction band E C , the valence band E V , and the Fermi levelE F . The two-dimension electron gas 2DEG region was marked

krawędź pasma przewodnictwa

krawędź pasma walencyjnego

obszar AlGaN AIN obszar GaN

energia Fermiego

(dwuwymiarowy gaz elektronowy)

p o w i e r z c h n i a

2DEG

E CE F

E V

Page 148: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 148/156

ELEKTRONIKA 3/2010146

a mianowicie glinu, który w połą czeniu z azotem tworzy azo-tek glinu – AlN i jest wykorzystywany jako warstwa buforo-wa pomiędzy podłożem SiC, a osadzanym GaN [1,2]. Osa-dzanie azotku glinu nie jest technologicznie proste zarównow przypadku osadzania na pod łożach SiC, jak i sza rze czykrzemie. Zwią zane jest to ze szczególnymi warunkami ter-modynamicznymi panują cymi w reaktorze, w którym zacho-dzi proces rozpadu reagentów, jak i reakcjami chemicznymipomiędzy reagentami. Proces osadzania przebiega przy

niskim ciśnieniu, w wyższej temperaturze ni ż temperatura,w jakiej osadza się GaN. Jedn ą z zalet tej metody jest to,że po osadzeniu warstwy AlN mo żna kontynuować procesosadzania bez konieczno ści stosowania procesu wygrze-wania i rekrystalizacji warstwy nukleacyjnej, prowadzą cdalszy proces epitaksji ju ż na strukturze uporz ą dkowanejkrystalogracznie.

Poważnym problemem w technologii otrzymywania warstwepitaksjalnych materia łów III-N na podłożach z SiC jest sto-sunkowo niska jakość przygotowania powierzchni płytek doepitaksji. Wysoka twardość węglika krzemu sprawia, że ob-róbka powierzchni jest bardzo trudna. W wyniku polerowanianie udaje się usunąć rys powsta łych po cięciu kryształu na

płytki, a chropowatość jest wyraźnie większa niż w przypad-ku innych półprzewodników. Poprawę morfologii powierzch-ni uzyskuje się zazwyczaj na drodze trawienia poleruj ą cegow mieszaninie wodoru i propanu lub silanu w temperaturze16000C. [3].

Dla epitaksji GaN na SiC, spo śród ponad dwustu znanychpolitypów węglika krzemu, wykorzystuje się przede wszyst-kim trzy, dwa o strukturze heksagonalnej 4H i 6H oraz politypo strukturze kubicznej – 3C. Ka żdy z nich występuje w dwóchpolarnościach powierzchni do epitaksji, węglowej i krzemo-wej [4]. Technologia osadzania azotku galu z zastosowaniemwarstwy zwilżają cej AlN bą dź AlGaN opracowana dla jedne-go typu podłoża SiC daje ró żne rezultaty w przypadku osa-dzania na innym politypie czy polarności powierzchni SiC [5].W rezultacie, w zależności od rodzaju podłoża i polarnościpowierzchni, wymagana jest optymalizacją warunków wzrostuGaN w celu uzyskania jak najlepszych rezultatów dla danegotypu kryształu podłożowego SiC. W trakcie przeprowadzo-nych dotychczas bada ń stwierdzono również, że wzrost GaNna pod łożach SiC zorientowanych wzd łuż osi (0001) kryszta łupodłożowego, bez stosowania intencjonalnego odchylenia,daje najlepsz ą jakość krystalograczną krystalizowanego ma-teriału i poprawną jakość morfologii powierzchni [3].

Eksperyment

Struktury wykonano w technologii LP MOVPE wykorzystują curzą dzenie do epitaksji AIX-2000/4RF-S z reaktorem pozio-mym, wyposażonym w grzany indukcyjnie gra towy grzejnik.Jako źródła reagentów wykorzystano: dla glinu – trójmetylog-lin (TMAl), dla galu – trójmetylogal (TMGa), azotu – amoniak(NH3). Gazem no śnym był wodór i azot, natomiast intencjo-nalne domieszkowanie krzemem warstw tworz ą cych barier ę

Al0.23GaN, w heterostrukturze epitaksjalnej tranzystora, uzy-skano wykorzystują c silan (SiH4). W prezentowanych bada-niach epitaksję prowadzono na pod łożach z węglika krzemuo politypie 4H, orientacji (0001) bez odchylenia i polarnościkrzemowej. Grubość warstw epitaksjalnych kontrolowa-no in-situ poprzez pomiar re ektancji światła o d ługości fali620nm.

Pomiary efektu Hall`a wykonano metodą Van der Pauw`aw polu magnetycznym o nat ężeniu 0,5 Tesli, w temperaturzepokojowej. Pomiary rentgenowskie zosta ły przeprowadzo-ne przy zastosowaniu wysokorozdzielczego dyfraktometru

rentgenowskiego, z germanowym monochromatorem Bar-telsa wykorzystują cym odbicie od płaszczyzn sieciowych{440}. Wykorzystano ceramiczną lampę rentgenowsk ą pro-dukcji rmy Philips z anodą miedziową wytwarzają cą wią zkę promieniowania rentgenowskiego o d ługości 0,15405 nm.Mierzono szerokość połówkową σ ┴ symetrycznego re eksu[200], pochodzą cego od warstwy epitaksjalnej GaN, zareje-strowaną metodą skanowania przestrzeni odwrotnej krysz-tału w kierunku prostopad łym do płaszczyzn odbijają cych

(θ/2θ scan mode), a tak że szeroko ść połówkową σ║ tegoreeksu zarejestrowan ą metodą skanowania w kierunkurównoległym (ω scan mode) do wspomnianych p łaszczyzn[MW]. Chropowatość powierzchni mierzono wykorzystują cmikroskop sił atomowych – AFM, pracują cy w trybie bez-kontaktowym.

Tranzystory zosta ły wykonane na wytrawionych jonowo ob-szarach typu mesa o wysoko ści 120 nm. Dren (D) i źródło (S)wykonano z kolejno napylonych warstw Ti(150Å)/Al(1500Å)/Ni(400Å)/Au(900Å), natomiast bramkę (G) o szeroko ści (Wg)i długości Lg=150 nm z Ni(400Å)/Au(2000Å). Bramka zosta-ła wykonana w technice elektronolitogra i (E-Beam). W celuwtopienia kontaktów oraz uzyskania ich charakterystyk omo-

wych napylone warstwy metali składają ce się na dren i źródłozosta ły wygrzane w 850°C w atmosferze azotu. Obszar czyn-ny przyrzą du zosta ł pokryty cienką warstwą SiN w celu pasy-wacji powierzchni i zminimalizowania pr ą dów upływu bramki.

Warstwa buforowa tranzystora

We wszystkich omawianych próbkach grubo ść oraz parame-try technologiczne osadzania warstwy AlN, zwilżają cej po-wierzchnię kryształu podłożowego z węglika krzemu przedosadzaniem GaN, by ły takie same. Osadzano j ą w tempera-turze 1070°C i ciśnieniu 50 mbar. Na rys. 2a przedstawionoobraz jakości powierzchni kryształu podłożowego z SiC orazwarstwy zwilżają cej z AlN (rys. 2b ) Warstwa AlN o grubości100 nm przykrywają c rysy znajdują ce się na powierzchni pod-łoża, minimalizuje ich wpływ na jakość powierzchni warstwyGaN, dzięki czemu uzyskano cią głą i gładką warstwę mate-riału (rys. 2c ).

Omawiane struktury różniły się warunkami wzrostu war-stwy GaN. Wykonano trzy struktury epitaksjalne, w którychazotek galu o grubo ści 1,6 μm osadzano w temperaturze1110°C, przy różnych ciśnieniach w reaktorze 50 mbar –[#1945], 125 mbar – [#1946] i 200 mbar – [#1937]. Stwierdzo-no, że zmiana ci śnienia wzrostu, wyraźnie wpływa na morfo-logię powierzchni otrzymywanego materia łu. Wyniki pomiaruchropowatości powierzchni, określone przez wielkość para-metru Ra skanowanego obszaru powierzchni GaN, pokaza łypoprawę jednorodności powierzchni azotku galu osadzanegoprzy wyższym ciśnieniu w reaktorze. Otrzymano nast ępują -ce wyniki Ra: #1945(50 mbar) = 1,2 nm, #1946(125 mbar)= 0,73 nm, #1937(200 mbar) = 0,62 nm przy rozmiarze ska-nowanego obszaru 30x30 um. Na rys. 2c przedstawionoobraz morfologii powierzchni GaN otrzymanego przy ciśnie-niu 200 mbar w reaktorze. Nale ży zaznaczyć, że przedsta-wiono obraz powierzchni otrzymanych próbek badawczycho wymiarze 30 x 30 μm, co nie jest spotykane w literaturze.Tak duże obrazy powierzchni nie s ą publikowane, ponieważ wówczas ujawniała by się s łaba jako ść powierzchni, bowiemdla ma łych obrazów np.: o rozmiarze 5 x 5 μm i mniejszych

jest mo żliwe wybranie miejsca pomiaru, o bardzo dobrej ja-kości powierzchni.

Wraz z poprawą jednorodności powierzchni nastą pi-ła poprawa jako ści krystalogracznej osadzonego GaN(tab.1 ).

Page 149: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 149/156

Page 150: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 150/156

ELEKTRONIKA 3/2010148

na próbkę kontakty z indu, wykonują c pomiar i poddają c ją ta-kiemu samemu procesowi wygrzewania, a nast ępnie pomia-rowi. Różnica w uzyskanych rezultatach pomiaru efektu Hall`az kontaktami z indu przed i po wygrzaniu (RTP) potwierdzatezę, że proces wygrzewania wp ływa na wynik wartości ruchli-wości 2DEG, a przez to na parametry uzyskanego przyrz ą du.Rozwią zanie tego problemu wymaga przeprowadzenia anali-zy strukturalnej bariery AlGaN przy wykorzystaniu mikroskopiitransmisyjnej (TEM) i jest przedmiotem osobnych bada ń.

W wyniku pomiaru rezystancji kontaktów omowych wykona-nego metod ą TLM, wyznaczono rezystancję kontaktów RC=1,5Ω·mm. Wartość ta świadczy o poprawności processingu przyrzą -dów i sugeruje, że różnice w otrzymanych rezultatach pomiarówefektu Hall`a mogą mieć przyczynę w zmianach strukturalnych

jakie zachodzą w barierze AlGaN podczas procesu wygrzewaniakontaktów, a nie s ą zwią zane z rezystancj ą kontaktów omowych.

Przykładową charakterystykę wybranego przyrzą du(Wg = 2x75 μm = 150 μm, D-S=3 μm) przedstawiono na rys. 5 ,natomiast parametry uzyskanych demonstratorów przyrz ą -dów zestawiono w tab. 2 .

Pomiary wykonano dla różnych szerokości bramki (Wg)oraz dwóch odleg łościach dren – źródło (D-S). Przebieg cha-

rakterystyk I(V) pokazuje jedną z najważniejszych zalet wyko-nywania przyrzą dów na SiC, któr ą jest dobrze odprowadza-nie ciepła, generowanego podczas pracy przyrz ą du, przezpodłoże. W przypadku struktur uzyskanych na pod łożachsza rowych wykresy zależności I(V) cechuje wyraźny zmniej-szanie warto ści natężenia pr ą du drenu (Id) powyżej wartościnapięcia (Vknee), przy którym osią gany jest maksymalny pr ą ddrenu (Idmax). Takiego wpływu wydzielanego ciepła, podczaspracy przyrzą dów, na ich charakterystyk ę pr ą dowo-napięcio-wą nie zaobserwowano w przypadku HEMT/SiC.

Na podstawie otrzymanych wyników można stwierdzić,że GaN osadzony na SiC, wg. opisanych wcze śniej wa-runków technologicznych, cechuje wysoka rezystywno ść,o wartości wystarczają cej do wykonania poprawnie dzia-łają cego przyrzą du, o czym świadczą wysokie napięciaprzebicia Vbr . Wartość transkonduktancji (Gm), a co za tymidzie pozosta łe wyniki charakterystyk I(V), w szczególnościIdmax, przyrzą dów zależą od parametrów elektrycznych dwu-wymiarowego gazu elektronowego. Na parametry te maj ą wpływ takie czynniki jak: skład chemiczny bariery AlxGa 1-xN,grubość warstw składowych, poziom i pro l ich domiesz-kowania, zastosowanie lub nie warstwy przykrywają cej,

Rys. 4. Schemat HEMT (nie w skali) oraz zdj ęcie przyrz ą du wykonane przy wykorzystaniu mikroskopu skaningowego. Zaznaczonoźród ło (S), dren (D), bramk ę (G). Bariera Al 0.23 GaN w heterostrukturze zosta ła intencjonalnie domieszkowana krzemem jak na rysun-ku. Powierzchnia tranzystorów dodatkowo zosta ła pokryta SiN, przez który wyprowadzono z D, S i G warstwy kontaktowe, czego niepokazano na schemacieFig. 4. The diagram of HEMT structure (not in scale) and SEM picture of the device. The drain (D), the source (S) and the gate (G) weremarked. Al 0.23 GaN barrier was intentionally Si-doped. The device surface was SiN passivated (not shown at the diagram)

Rys. 5. Przyk ładowe wyniki pomiarów charakterystyki tranzystora HEMT: a) pr ą dowo-napi ęciowe – I(V), b) transkonduktancji – GmFig. 5. HEMT example measurements results, the characteristics of: a) current-voltage – I(V), b) transconductance – Gm

0 2 4 6 8 10 12 14 160,000

0,067

0,133

0,200

0,267

0,333

0,400

0,467

0,533

0,600

0,667

0,733

gate 2x75 µm DS-3µmIdmax= 0.634 [A/mm]

Vknee pinch-off = -5 [V]

Vgate[V] 1 0 -1 -2 -3 -4 -5

I d s

[ A / m m

]

Vds [V]-6 -5 -4 -3 -2 -1 0 1

0,0000,0130,0270,0400,0530,0670,080

0,0930,1070,120

0,1330,1470,1600,1730,187

gmmax= 160 [mS/mm]

G m

[ S / m m

]

Vgs [V]

Page 151: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 151/156

ELEKTRONIKA 3/2010 149

warunki technologiczne w jakich osadza si ę materia ł barie-ry. Na podstawie uzyskanych wyników można stwierdzić,że zastosowana bariera Al 0.23GaN była za gruba, o czym

świadczy duża wartość ca łkowitego napięcia odcięcia przy-łożonego do bramki (Vpinch= -5 V wobec pożą danej -3 V).Potwierdzono to wykonują c heterostruktur ę epitaksjalną HEMT/SiC ze zmniejszoną o ok. 30%. grubo ścią bariery

Al0.23GaN, przy zachowaniu tych samych parametrów tech-nologicznych wzrostu warstw składają cych się na struktur ę epitaksjalną HEMT. Otrzymane na takiej strukturze epitak-sjalnej przyrzą dy cechowa ła niska warto ść ca łkowitegonapięcia odcięcia przyłożonego do bramki Vpinch= -2 V, coprzedstawiono na rys. 6.

Rys. 6. Wyniki pomiarów charakterystyki pr ą dowo-napi ęciowejtranzystora HEMT po zmianie grubo ści bariery Al 0.23 GaNFig. 6. The current-voltage characteristics of HEMT structurewith thinner Al 0.23 GaN barrier

Tab. 2. Wyniki charakteryzacji demonstratorów tranzystorów przyrzą dów HEMT/SiC. Moc wyliczono ze wzoru P= 1/8[Idmax(Vknee-Vbr )] [8]Tabl. 2. The HEMT/SiC device results. The power output was calculated with formula P= 1/8[Idmax(Vknee-Vbr )] [8]

Wg [μm] D-S [μm] Idmax

[A/mm]Vknee

[V]Vpinch

[V]Gmmax

[mS/mm]Vbr @-5

[V]f t

[GHz]f max

[GHz]P

[W/mm]

2x30 3 0.672 6.6 -5 165 35 18.8 40 2,4

2x50 3 0.684 6.3 -5 140 57 27.3 40 4,3

2x75 3 0.634 5.5 -5 160 63 32.8 38.5 4,6

2x100 3 0.439 4.5 -5 100 50 33 34.2 2,52x125 3 0.448 4.65 -5 100 50 28.3 32.7 2,5

2x50 3 0.684 6.3 -5 140 57 27.3 40 4,3

2x50 4 0.583 5.8 -5 130 72 26.4 42.7 4,8

2x50 5 0.447 6.1 -5 112 80 14.9 30 4,1

Podsumowanie

W pracy przedstawiono wpływ ciśnienia w reaktorze podczasosadzania na popraw ę jakości powierzchni oraz jakości kry-stalogracznej warstw azotku galu osadzanych na w ęglikukrzemu. Warstwy o najlepszej jako ści uzyskano podczas osa-dzania GaN przy ciśnieniu 200 mbar.

Opracowaną technologię osadzania warstw GaN na SiCz powodzeniem zastosowano do wytwarzania heterostruktur

AlGaN/AlN/GaN/SiC.

Wytworzone na tych heterostrukturach przyrz ą dy potwier-dziły wysoką rezystywność warstw GaN/SiC, wystarczają cą do osadzania heterostruktur HEMT/SiC s łużą cych do wytwa-rzania tranzystorów z dwuwymiarowym gazem elektronowymtypu HEMT. Wartość uzyskanych parametrów przyrz ą dów(f max=42 GHz i P=4,8 W/mm) jest wynikiem typu zastosowa-nej bariery, wynika również z rozmiaru przyrzą du. Wiadomym

jest, że ogromny wpływ na wartości uzyskiwanych maksymal-nych częstotliwości pracy f max i gęstości mocy P ma technolo-gia i konstrukcja przyrzą du.

Podzi ękowania:

Doktorowi Markowi Wójcikowi i doktorowi Jaros ławowi Gacy(ITME) za wykonanie pomiarów HRXRD.Profesorowi Ekmelowi Ozbay`owi za umo żliwienie pobytu na-ukowego w NanoTAM, w Bilkent University, w Ankarze, w Turcji,podczas którego autor wykona ł processing i charakteryzacj ę tranzystorów HEMT.

Cz ęść niniejszej pracy by ła wspó ł nansowana przez Uni ę Euro-pejsk ą w ramach Europejskiego Funduszu Spo łecznego, projekt„Program Rozwojowy Politechniki Warszawskiej”.Cz ęść niniejszej pracy by ła wspó ł nansowana z PBZ –MeiN-6/2/2006 „Opracowanie procesów technologicznych homo- i he-teroepitaksji na pod łożach z w ęglika krzemu”.

Literatura

[1] Boeykens S., Leys M.R., Germain M., Belmans R., Borghs G.: J.Crystal Growth 272 (2004) 312.

[2] Moran B., Wu F., Romanov A.E.,. Mishra U.K, Denbaars S.P.,Speck J.S.: J. Crystal Growth 273 (2004) 38.

[3] Caban P., Kosciewicz K., Strupinski W., Wojcik M., Gaca J.,Szmidt J., J. Ozturk J., Ozbay E.: Journal of Crystal Growth 310(2008) 4876–4879.

[4] Kościewicz K., Tymicki E., Grasza K.: SiC – materiał dla ele-ktroniki. Elektronika, nr 9/2006.

[5] Caban P., Rudziński M., Strupiński W., Szmidt J.: Wpływpolarności podłoży SiC na wzrost GaN otrzymanego metoda LPMOVPE. VIII Krajowa Konferencja Elektroniki, 07- 10.06.2009.

[6] Shen L., Heikman S., Moran B., Cof e R., Zhang N.-Q., ButtariD., Smorchkova I.P., Keller S., DenBaars S.P., Mishra UK.: IEEEElectron Device Lett. 22,457 (2001).

[7] Caban P., Strupiński W., Szmidt J.: Azotek galu na homoepitaksjal-

nej warstwie SiC – aplikacja w strukturze HEMT z nanometrową barier ą AlGaN. P. III Krajowa Konferencja Nanotechnologii NANO2009, Warszawa 22-26 czerwca 2009.

[8] High-Speed Semiconductor Devices, A Wiley-Interscience Publi-cation, John Wiley and Sons, Inc. New York (1990).

Page 152: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 152/156

ELEKTRONIKA 3/2010150

Sympozjum „Fotonika i Inżynieria Sieci Internet” (Pho-tonics and Web Engineering ) jest tradycyjnie organizo-wane dwa razy w roku na terenie Wydzia łu Elektronikii Technik Informacyjnych WEiTI Politechniki Warszaw-skiej (w styczniu) i w WILDZE (w maju) pod protekto-ratem IEEE (Polska Sekcja i Region 8), SPIE – TheInternational Society for Optical Engineering, PSP

– Photonics Society of Poland, Komitetu Elektronikii Telekomunikacji PAN oraz Instytutu Systemów Elek-tronicznych Politechniki Warszawskiej. Sympozjum jest

znane na sieci Internet pod akronimem WILGA. Sym-pozjum jest organizowane przez studencko-doktoran-cką grupę badawcz ą PERG-ELHEP ISE PW od 1998roku. XXV z kolei Sympozjum zgromadziło kilkadzie-sią t osób i prezentacji z tematyki projektowania, wy-konywania i testowania zaawansowanych systemówelektronicznych i fotonicznych w aspekcie sprzętowymi programistycznym. Uczestnikami Sympozjum są głów-nie doktoranci z Politechniki Warszawskiej i instytucjiwspółpracują cych, jak np. Wydziału Fizyki UniwersytetuWarszawskiego, Instytutu Problemów J ą drowych, Cen-trum Badań Kosmicznych, itp. przy realizacji projektów

badawczych a tak że magistranci i dyplomanci studiówinżynierskich. Doktorantom często towarzyszą ich opie-kunowie naukowi, przedstawiają cy wprowadzenie dosesji tematycznych.

Informatyka biomedyczna

Sesja biomedyczna by ła poświęcona problematyce od-krywania wiedzy z masywnych medycznych baz danychpomiarowych. Warunkiem powodzenia procesu odkrywa-nia wiedzy jest jakość dużych zbiorów danych. Takich bazdanych jest na razie niewiele. Bazy danych z przesz łościna ogó ł nie spe łniają warunku jakości, są często niepe łne.Ten ciekawy kierunek badawczy jest zwią zany z budową od nowa wielu baz danych medycznych i dotyczy szero-

kich zagadnień organizacji służby zdrowia w niedalekiejprzyszłości. Sesji informatyki biomedycznej przewodni-czył prof. Jan Mulawka.

Projektowanie obiektowe systemówelektronicznych

Sesja po święcona obiektowemu projektowaniu sprzętui oprogramowania dotyczyła zagadnie ń optymalizacji in-terakcji i podziału zada ń pomiędzy te dwie warstwy. Po-ruszano nowe zagadnienia obiektowego podej ścia pro-

jektowego do sprzętu tak, aby uzyska ć jak największą zgodność między strukturami obiektowymi w obu war-stwach. Rozwa żano automatyzacj ę generacji optymalne-go i złożonego kodu VHDL a także generacji dokumentacji

25 Sympozjum IEEE-SPIE„Fotonika i In żynieria Sieci Internet”

WEiTI, Politechnika Warszawska, 29–30 stycznia 2010

Uczestnicy sesji systemów elektronicznych dla eksperymentów zyki wysokich energii 25 Sympozjum WILGA;od lewej siedz ą : prof. mgr in ż. Grzegorz Kasprowicz, prof. nzw. dr hab. in ż. Ryszard Romaniuk, prof. dr hab. in ż. Tadeusz Morawski,

mgr in ż. Micha ł Ramotowski, dr in ż. Krzysztof Po źniak

Page 153: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 153/156

Page 154: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 154/156

ELEKTRONIKA 3/2010152

Zygmunt Pi ą tek, Pawe ł Jab ło ń ski, Podstawy teoriipola elektromagnetycznego, Wydawnictwa Nauko-wo-Techniczne, 2010, s. 470, ISBN 978-83-204-3599-3

Teoria pola elektromagnetyczne-go nale ży do szczególnie trud-nych przedmiotów akademickichi jest przedmiotem niech ę tnieodbieranym przez studentów.

Trudny, ale konieczny formalizmmatematyczny i niezb ę dne pod-stawy zyki sprawiaj ą , że prowa-dz ą cy ten przedmiot staj ą przeddylematem takiego prowadzeniawykładu b ą dź ćwicze ń tablico-wych, aby sta ły się one zrozumia-łe i przyswajalne dla studentów.St ą d te ż pojawienie si ę podr ę cz-nika akademickiego pt. Podstawy

teorii pola elektromagnetycznego nale ży przyj ąć z uznaniemzw łaszcza, że na rynku jest niedostatek tego rodzaju pozycji,a wi ę kszo ść z nich zosta ła dawno wydana i istnieje potrzebanowego, ś wieżego spojrzenia na t ę tematyk ę . Luk ę tę , wg mo-

jej opinii wype łnia niniejszy podr ę cznik. Autorzy w bardzo umie- ję tny sposób, wykorzystuj ą c swoje wieloletnie do ś wiadczeniedydaktyczne, prezentuj ą nie łatw ą tematyk ę , wiążą c j ą z prak-tyką tam gdzie tylko to jest mo żliwe. Bardzo obszerne komen-tarze natury matematycznej i zycznej sprawiaj ą , że tre ść pod-r ę cznika powinna by ć łatwo przyswajalna dla studentów. Zalet ą podr ę cznika jest przejrzyste i proste przedstawienie procesuformu łowania i opisu zagadnie ń pola elektromagnetycznegoi przez to podr ę cznik mo że by ć kierowany do szerokiego kr ę guodbiorców.

Podr ę cznik, oprócz rozdzia łu stanowi ą cego wprowadzeniedo analizy i algebry wektorowej, obejmuje pole elektrostatycz-ne, przep ływowe, magnetostatyczne i elektromagnetyczne,

wolnozmienne pole harmoniczne, fal ę p łask ą , linię d ług ą , fa-lowody, ś wiat łowody oraz rezonatory. Zakres tematyczny pod-r ę cznika jest zgodny z wymaganiami dla podr ę czników aka-demickich oraz opracowa ń dydaktycznych i stanowi zwart ą ca łość . Wype łnia te ż minima programowe przedmiotu elektro-technika teoretyczna-teoria pola elektromagnetycznego opra-cowane przez Ministerstwo Nauki i Szkolnictwa Wy ższego.

Zagadnienia teoretyczne pola elektromagnetycznego Au-torzy wyja ś niaj ą w sposób bardzo drobiazgowy za pomoc ą stosownych komentarzy zwracaj ą cych uwag ę na interpretacj ę zyczn ą zjawisk, starannie dobranych i wykonanych rysunkóworaz przyk ładów z pe łnymi rozwi ą zaniami. Dzi ę ki temu zasto-sowany z konieczno ś ci z łożony aparat matematyczny u łatwiaCzytelnikowi zrozumienie i przyswojenie trudnych zagadnie ń polowych. Ponadto aparat ten zosta ł wyczerpuj ą co zaprezento-wany w pierwszym rozdziale ksi ąż ki, co zwalnia Czytelnika odposzukiwania tych zagadnie ń w podr ę cznikach z matematyki.

Podr ę cznik napisany jest na wysokim poziomie meryto-rycznym i edytorskim. Jest on skierowany przede wszystkimdo studentów kierunków elektrotechnika, zyka czy elektronikai telekomunikacja oraz specjalno ś ci elektrodynamika technicz-na, maszyny elektryczne, automatyka i robotyka oraz techni-ka wysokich napi ęć . Trudniejsze zagadnienia przedstawionew podr ę czniku mog ą by ć z powodzeniem prezentowane nastudiach doktoranckich oraz b ę dą użyteczne dla pracownikównaukowych i osób zajmuj ą cych si ę zawodowo elektrotechnik ą .Systematyczny sposób prezentacji materia łu oraz du ża liczba

rozwi ą zanych zada ń bę dzie du żym u łatwieniem równie ż dlatych, którzy maj ą c podstawy matematyczno- zyczne, chcielibyuzupe łnić swoj ą wiedz ę .

Prof. dr hab. in ż. Marian Pasko

Jó źwicki Romuald: Technika laserowa i jej zastoso-wania. O cyna Wydawnicza Politechniki Warszaw-skiej, Warszawa 2009

Wydany przez OWPW pod-r ę cznik ma na celu zapoznanieczytelnika z budow ą i zasa-dą dzia łania laserów a tak żez mo ż liwoś ciami wykorzystaniatych urz ą dze ń .

Książ ka jest podzielona na

dwie cz ęś ci. W pierwszej z nichzatytu łowanej „Technika lase-rowa”, autor omawia zycznepodstawy dzia łania lasera, bu-dow ę ró żnych typów obecniestosowanych laserów: (gazowe,lasery na ciele sta łym, ś wiat-łowodowe, mikrolasery i in.).

Scharakteryzowano wi ą zk ę generowan ą przez laser, tj. wid-mo i jej rozk ład przestrzenny a tak że przekszta łcenie wi ą zkiprzez uk łady optyczne lasera. Omówiono zagadnienie sta-bilizacji cz ę stotliwo ś ci i d ługo ś ci fali optycznej generowanejprzez laser oraz metody uzyskiwania impulsów o wysokiejmocy wi ą zki.

W kolejnych rozdzia łach przedstawiono najcz ęś ciej stoso-wane obecnie lasery: pó łprzewodnikowe i z przestrajaniemd ługo ś ci fali. Diody elektroluminescencyjne nie s ą wła ś ciwielaserami, ale by ły ich protoplast ą . Zamieszczono ich skró-cony opis ze wzgl ę du na wzrastaj ą cą rolę tych elementóww technice o ś wietleniowej. Skupiona wi ą zka ś wiat ła lasero-wego stwarza niebezpiecze ństwo uszkodzenia wzroku u żyt-kownika. Omówiono norm ę dotycz ą cą bezpiecze ństwa orazszczegó łowo zasady BHP pracy z laserami. Na zako ńczenietej cz ęś ci przeanalizowano mo ż liwoś ci uzyskania monochro-matycznej wi ą zki ś wiat ła o ma łym k ą cie rozbie żno ś ci z innychźróde ł i zwi ą zane z tym koszty.

Drug ą cz ęść podr ę cznika po ś wiecono zastosowaniomwspó łczesnych laserów w technice i medycynie. Poniewa ż

jest bardzo obszerna tematyka, autor skupi ł się na przypad-kach, które odegra ły szczególn ą rolę we wspó łczesnej naucei technice. Omówiono wykorzystanie monochromatyczno ś ciwią zki laserowej (m.in. interferencja, hologra a, anemome-tria, rede nicja wzorca odleg łoś ci), wysokiego stopnia jej sku-pienia (m.in. pomiary triangulacyjne w geodezji), impulsowejpracy lasera (m.in. monitorowanie ś rodowiska, precyzyjnypomiar odleg łoś ci), koncentracji mocy i energii wi ą zki (m.in.laserowa obróbka materia łów, fotolitogra a), przestrajaniad ługo ś ci fali (zastosowania w medycynie).

Taki uk ład ksi ąż ki pozwala zrozumie ć niebywa ły rozwójtechnologii laserowej i jej wp ływ na rewolucj ę naukow ą i tech-

niczn ą w II po łowie XX w. W zamy ś le autora, podr ę cznik mabyć pomocny zarówno u żytkownikom laserów, bez zag łębia-nia si ę w technologi ę wykonania, jak studentów chc ą cych po-zna ć aktualny stan wiedzy z tej dziedziny. (kk)

Page 155: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 155/156

Page 156: Elektronika_2010-03.pdf

8/9/2019 Elektronika_2010-03.pdf

http://slidepdf.com/reader/full/elektronika2010-03pdf 156/156