8
222 정보과학회논문지 : 정보통신 제 40 권 제 4 (2013.8) 의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning 기반의 기회적 채널 호핑 기법 (An opportunistic Channel Hopping Scheme for Reducing Communication Delay Based on Q-Learning in the Medical Body Area Network) 신승환 로씨카말 홍충선 †† 최종원 ††† (Seung Hwan Shin) (Rossi Kamal) (Choong Seon Hong) (Jongwon Choe) FCC에서 승인한 MBAN(Medical Body Area Network) 주파수 대역인 2,360-2,400MHz이미 PU(Primary User)들에게 할당되어 있어 SU(Secondary User)인 의료용 기기들은 인지무선 기술을 사용해야만 한다. 따라서 본 논문에서는 이러한 환경에서 끊김 없는 모니터링 시스템을 구현하기 위한 채 널 호핑 기법을 제안한다. SU들은 두 개의 송수신기를 가지고 서로 다른 채널 호핑 시퀀스를 통해 채 널 호핑을 수행하고 통신한다. 하나의 인터페이스를 가지고 채널 호핑을 할 때보다 두 개의 인터페이스를 통해 채널 호핑을 할 때 더 끊김 없는 통신이 가능해져 보다 안정된 서비스를 제공할 수 있도록 한다. 한 채널 호핑에 Q-러닝 알고리즘을 적용하여 학습을 통해 통신간 지연을 줄이고자 한다. 키워드: 인지 무선, 신체 영역 네트워크, 통신 지연, 채널 호핑, Q-러닝 Abstract In this paper, we proposed a Q-learning based opportunistic channel hopping scheme for seamless monitoring in FCC allowed MBAN (Medical Body Area Network) at 2,360-2,400MHz. Each SU (Secondary User) performs the channel hopping through different sequences with multiple transceivers. When a SU performs opportunistic channel hopping using two transceivers, it provides less communication delay and stable service than conventional mechanism with one transceiver. Also, for decreasing communication delay, Q-learning is applied to our proposed channel hopping scheme. We propose a Q-learning based channel hopping mechanism so that healthcare devices can learn how to hop channels by considering the cost of channel sensing, transmission and channel hopping. Keywords: cognitive radio, medical body area network, communication delay, opportunistic channel hopping, Q-learning 연구는 지식경제부 및 정보통신산업진흥원의 대학 IT연구센터 육성지원 사업 의 연구결과로 수행되었음(NIPA-2013-(H0301-13-2001)) 논문접수 심사완료 : : 201212132013328†† ††† 학생회원 종신회원 종신회원 : : : 경희대학교 컴퓨터공학과 [email protected] [email protected] 경희대학교 컴퓨터공학과 교수 [email protected] (Corresponding author) 숙명여자대학교 컴퓨터과학과 교수 [email protected] Copyright2013 한국정보과학회ː개인 목적이나 교육 목적인 경우, 이 저작 물의 전체 또는 일부에 대한 복사본 혹은 디지털 사본의 제작을 허가합니다. 이 때, 사본은 상업적 수단으로 사용할 수 없으며 첫 페이지에 본 문구와 출처 를 반드시 명시해야 합니다. 이 외의 목적으로 복제, 배포, 출판, 전송 등 모든 유형의 사용행위를 하는 경우에 대하여는 사전에 허가를 얻고 비용을 지불해야 합니다. 정보과학회논문지: 정보통신 제40권 제4(2013.8)

의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning …networking.khu.ac.kr/layouts/net/publications/data/... · 해당 주파수 대역을 이용하여

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • 222 정보과학회논문지 : 정보통신 제 40 권 제 4 호(2013.8)

    의료 신체 영역 네트워크에서 통신지연

    감소를 위한 Q-Learning 기반의

    기회적 채널 호핑 기법(An opportunistic Channel Hopping Scheme for Reducing

    Communication Delay Based on Q-Learning in the Medical

    Body Area Network)

    신 승 환† 로 씨 카 말

    † 홍 충 선

    †† 최 종 원

    †††

    (Seung Hwan Shin) (Rossi Kamal) (Choong Seon Hong) (Jongwon Choe)

    요 약 FCC에서 승인한 MBAN(Medical Body Area Network) 주파수 대역인 2,360-2,400MHz는

    이미 PU(Primary User)들에게 할당되어 있어 SU(Secondary User)인 의료용 기기들은 인지무선 기술을

    사용해야만 한다. 따라서 본 논문에서는 이러한 환경에서 끊김 없는 모니터링 시스템을 구현하기 위한 채

    널 호핑 기법을 제안한다. 각 SU들은 두 개의 송수신기를 가지고 서로 다른 채널 호핑 시퀀스를 통해 채

    널 호핑을 수행하고 통신한다. 하나의 인터페이스를 가지고 채널 호핑을 할 때보다 두 개의 인터페이스를

    통해 채널 호핑을 할 때 더 끊김 없는 통신이 가능해져 보다 안정된 서비스를 제공할 수 있도록 한다. 또

    한 채널 호핑에 Q-러닝 알고리즘을 적용하여 학습을 통해 통신간 지연을 줄이고자 한다.

    키워드: 인지 무선, 신체 영역 네트워크, 통신 지연, 채널 호핑, Q-러닝

    Abstract In this paper, we proposed a Q-learning based opportunistic channel hopping scheme for

    seamless monitoring in FCC allowed MBAN (Medical Body Area Network) at 2,360-2,400MHz. Each

    SU (Secondary User) performs the channel hopping through different sequences with multiple

    transceivers. When a SU performs opportunistic channel hopping using two transceivers, it provides

    less communication delay and stable service than conventional mechanism with one transceiver. Also,

    for decreasing communication delay, Q-learning is applied to our proposed channel hopping scheme.

    We propose a Q-learning based channel hopping mechanism so that healthcare devices can learn how

    to hop channels by considering the cost of channel sensing, transmission and channel hopping.

    Keywords: cognitive radio, medical body area network, communication delay, opportunistic channel

    hopping, Q-learning

    ․연구는 지식경제부 및 정보통신산업진흥원의 대학 IT연구센터 육성지원 사업

    의 연구결과로 수행되었음(NIPA-2013-(H0301-13-2001))

    논문접수

    심사완료

    :

    :

    2012년 12월 13일

    2013년 3월 28일

    ††

    †††

    학생회원

    종신회원

    종신회원

    :

    :

    :

    경희대학교 컴퓨터공학과

    [email protected]

    [email protected]

    경희대학교 컴퓨터공학과 교수

    [email protected]

    (Corresponding author임)

    숙명여자대학교 컴퓨터과학과 교수

    [email protected]

    CopyrightⒸ2013 한국정보과학회ː개인 목적이나 교육 목적인 경우, 이 저작

    물의 전체 또는 일부에 대한 복사본 혹은 디지털 사본의 제작을 허가합니다.

    이 때, 사본은 상업적 수단으로 사용할 수 없으며 첫 페이지에 본 문구와 출처

    를 반드시 명시해야 합니다. 이 외의 목적으로 복제, 배포, 출판, 전송 등 모든

    유형의 사용행위를 하는 경우에 대하여는 사전에 허가를 얻고 비용을 지불해야

    합니다.

    정보과학회논문지: 정보통신 제40권 제4호(2013.8)

  • 의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning 기반의 기회적 채널 호핑 기법 223

    1. 서 론

    미국 연방 통신 위원회(FCC, Federal Communi-cations

    Commission)는 의료 네트워크를 위하여 주파수를 할당

    하였다[1-6]. 608-614MHz, 1,395-1,400MHz, 1,427-

    1,432MHz 대역을 WMTS(Wireless Medical Telemetry

    Services)로, 402-405MHz를 MICS(Medical Implant

    Communication Service)로, 401-406MHz를 MedRadio

    (Medical Device Radio communication)로, 그리고 902-

    908MHz, 2.4-2.4835GHz, 5.15-5.35GHz, 5.725-5.825

    GHz를 ISM(Industrial, Scientific and Medical)으로

    할당하여 의료 분야에서 사용할 수 있도록 허가했다.

    해당 주파수 대역을 이용하여 의사들은 심전도, 혈당,

    혈압, 혈중 산소 농도 측정 센서 등과 같은 헬스케어 장

    치들을 환자에게 연결하여 무선으로 모니터링 할 수 있

    다. 하지만 WMTS와 MICS, ISM에서 사용하는 주파

    수에는 해당 주파수 대역을 사용하고 있는 다른 기기들

    이 많이 있다. 특히 2.4GHz 대역은 블루투스, PCS, 와

    이파이, Zigbee등이 함께 사용하고 있다. 이로 인하여

    의료 장비 들이 WMTS, MITS, ISM의 주파수 대역을

    원활하게 사용하기 어려운 문제점이 발생한다. 의료 장

    비들이 통신하기 위해서는 다른 기기들의 간섭에서 자

    유로운 주파수 대역이 필요하다.

    이러한 이유들로 인해 최근 FCC에서는 주파수 정책

    을 수정하여 새로운 주파수 대역을 의료 장비 통신에

    할당하였다. 2,360-2,400MHz 주파수 대역을 MBAN

    (Medical Body Area Network)로 할당하여 의료 장비

    들이 이용할 수 있게 하였다[1-6]. 표 1은 MBAN 주파

    수 대역을 사용하는 PU(Primary User)의 목록을 보여

    준다.

    MBAN 주파수 대역을 사용하는 아마추어 라디오

    (2,390-2,450MHz)나 항공 이동용 텔레메트리 서비스

    (2,360-2,395MHz)는 빈도수가 높지 않기 때문에 의료

    기기 들이 간섭으로부터 비교적 자유롭게 MBAN 주파

    수 대역을 사용할 수 있다.

    MBAN에서는 현재 환자의 상태를 끊임없이 모니터

    링 하는 것이 중요하다. 특히 응급 상황일 때 환자 상태

    를 실시간으로 모니터링이 가능한지의 여부는 사람 목

    표 1 MBAN 주파수 대역을 사용하는 PU

    Table 1 List of PU using MBAN band

    Primary User Band Secondary User

    Aeronautical mobile

    telemetry2,360 - 2,395MHz

    Healthcare

    (Medical)

    devices

    Radio astronomy 2,370 - 2,390MHz

    Amateur Radio 2,390 - 2,450MHz

    Aviation 2,300 - 2,390MHz

    숨과 관련된 굉장히 중요한 일이다. 하지만 MBAN 주

    파수 대역을 사용하는 항공 이동용 텔레메트리나 아마

    추어 라디오와 같은 PU가 접근하면 SU(Secondary

    User)인 의료 기기들은 사용하던 채널에서 PU에 간섭

    을 주지 않기 위해 다른 채널로 이동하여야 한다. 이 때

    SU들은 채널 호핑 기법을 이용하여 다른 채널 이동한다.

    채널 호핑 기법이란 SU들이 CCC(Common Control

    Channel)없이 채널을 이동하는 기법이다. SU들이 각

    타임라인 마다 채널을 이동하면서 통신하기 위한 다른

    SU를 찾는다. 채널을 이동하여 서로 다른 SU가 같은

    채널에서 만나면 서로 통신하는 기법이다. 하지만 일반

    적인 채널 호핑에는 심각한 문제를 야기시킬 수 있는

    요소가 있다. SU들이 PU가 접근할 때 다른 채널로 이

    동하는 동안 환자의 상태를 모니터링 하기 위한 통신이

    끊어 지게 된다[7-10]. 이는 생명과 연관된 의료 네트워

    크에서 굉장히 심각한 문제를 야기할 수 있다. 의료기기

    통신 환경에서는 끊임없는 통신이 필요하다. 따라서 본

    논문에서는 최대한 통신의 끊김이 없는 채널 호핑 기법

    을 위해 두 개의 송수신기를 사용하는 채널 호핑 기법

    을 제안하고자 한다. 두 개의 송수신기를 이용하면 하나

    의 링크가 PU로 인해 끊기더라도 나머지 다른 하나의

    링크는 끊기지 않았기 때문에 전체적인 통신은 끊어지

    지 않는다. 또한 통신이 끊어졌을 때 새로운 통신이 이

    루어지기까지의 지연을 줄이기 위한 최적의 채널 호핑

    시퀀스를 제공하기 위해 Q-learning 알고리즘[11]을 적

    용한다.

    본 논문에서는 자율 관리 소프트웨어를 통해 제안하

    는 채널 호핑 기법을 구현하고[12-14], 하나의 송수신기

    를 사용했을 때와 두 개의 송수신기를 사용했을 때의

    전력 소모와 통신지연에 대해 성능평가 수행한다.

    2. 관련연구

    본 장에서는 의료 기기 통신에서의 인지 무선 네트워

    크에 대한 연구와 일반적인 채널 호핑 기법에 대하여

    정리하여 제안하는 알고리즘과 비교한다.

    2.1 인지 무선을 이용한 의료기기 통신

    FCC에서 환자들의 신체 정보와 관련된 데이터를 이

    용하여 통신하기 위해 기존에 사용하던 주파수를 의료

    기기의 통신에 할당하였다. 이로 인해 의사들은 외부에

    서도 병원에 입원해 있거나 집에서 요양하는 환자들의

    상태를 실시간으로 확인할 수 있게 되었다. 하지만 동일

    한 주파수 대역을 사용하는 많은 다른 기기들로 인해

    의료기기들이 원활하게 통신하는 것이 힘들어졌다. 따라

    서 다른 기기들의 간섭을 피하기 위하여 의료기기 통신

    에 인지 무선을 적용하는 연구들이 진행되고 있다.

    그 중 WMTS(Wireless Medical Telemetry Service)

  • 224 정보과학회논문지 : 정보통신 제 40 권 제 4 호(2013.8)

    는 2000년도에 FCC에서 정의한 의료기기 통신 서비스이

    다[2]. 608-614MHz, 1,395-1,400MHz, 1,427-1,432MHz

    에 해당하는 대역을 WMTS의 기기들이 사용할 수 있

    도록 할당하였다. 하지만 디지털 텔레비전 채널 37번이

    동일한 주파수 대역을 사용하고 있어서 WMTS 서비스

    와 간섭이 발생한다. 이러한 스펙트럼 부족 문제, 낮은

    이용률, 간섭 등의 문제를 해결하기 위해 인지 무선을

    적용하였다. 의료 송수신기에 주파수에 민감한 front-

    end를 장착하여 PU뿐만 아니라 기존의 다른 의료 기기

    에도 영향을 주지 않고 WMTS 대역의 일부를 사용할

    수 있다.

    2.2 채널 호핑

    채널 호핑은 중앙 제어 채널을 사용하지 않는 멀티채

    널 인지 무선에서 발전해온 기술이다[10]. SU들은 프레

    임을 전송하기 위해 채널 호핑 시퀀스에 따라 채널을

    이동한다. 채널 이동 중에 통신하고자 하는 다른 SU를

    같은 채널에서 만나면 서로 통신을 하게 된다. SU들은

    PU에게 간섭을 주지 않고 SU들 간의 통신을 지속하는

    것을 보장한다. SU들은 quite period 동안에 현재 채널

    에서 어떠한 신호도 감지하지 못한다면 현재 채널에는

    PU가 없다고 가정하고 해당 채널을 사용한다. PU가 해

    당 채널에 존재하지 않을 때, SU는 advertising, nego-

    tiation, data exchange 세 가지의 명령을 수행하여 다

    른 SU와 데이터를 주고 받는다.

    3. 제안하는 Q-learning 기반 opportunistic

    채널 호핑 기법

    3.1 시스템 모델

    본 논문에서는 MBAN에서의 통신을 기반으로 하여

    병원 내에서 의료 기기 장비들이 통신 하는 시스템 모

    델을 정립하였다.

    병원 내에는 각 병실마다 환자들이 누워 있다. 환자들

    몸에는 환자들의 신체 정보를 감지할 수 있는 신체 센

    서 및 의료 기기들(에이전트)이 장착되어 있다. 각 의료

    기기들은 모니터링한 환자의 신체 정보를 병실 내에 있

    는 아답터로 전달한다. 여러 의료 기기들로부터 신체 정

    보를 받은 각 병실 안의 아답터는 수신한 정보를 매니

    저로 전달한다. 매니저는 각 병실에서 수집된 환자의 신

    체 정보들을 수집하여 이에 해당하는 정책을 판단하고

    해당 정책을 게이트웨이와 의료기기들에게 전달한다.

    매니저와 아답터들은 유선으로 연결되어 있고 에이전

    트들과 아답터들은 4개의 채널을 이용하여 무선 통신을

    한다고 가정한다. 각 기기들은 2개의 송수신기를 가지고

    있고 각 송수신기는 서로 다른 채널 호핑 시퀀스를 가

    지고 통신을 한다고 가정한다. PU는 항공 이동용 텔레

    메트리, 아마추어 라디오 등이 있고, SU는 에이전트와

    그림 1 시스템 모델

    Fig. 1 System Model

    아답터라고 가정한다. 그림 1은 본 논문의 시스템 모델

    을 보여준다.

    3.2 두 개의 송수신기를 사용한 채널 호핑

    사람의 생명과 연관되어 있는 MBAN에서의 통신에

    서는 끊임없는 통신이 특히 더 중요하다. 따라서 본 논

    문에서는 끊임없는 통신을 하기 위해 각 기기 들이 두

    개의 송수신기를 가지고 통신하는 모델을 제안하였다.

    병원 내에서 각 의료기기들은 두 개의 송수신기를 이

    용하여 서로 다른 두 개의 채널에서 통신하고 있다. 이

    때, PU인 비행기가 병원 근처로 접근하여 의료기기가

    사용하는 채널 중 하나를 사용하려 한다. SU인 의료기

    기는 사용하던 채널의 통신을 끊고 다른 채널로 이동하

    여 통신하여야 한다. 하지만 다른 하나의 송수신기가 다

    른 채널을 동시에 이용하고 있었기 때문에 결국에는 끊

    임없는 통신이 가능해진다.

    그림 2는 채널 i를 현재 PU가 사용하고 있는 지를

    나타낸다. 채널 i에서 색이 칠해져 있지 않은 부분은

    PU가 사용하지 않는 IDLE상태이고, 색이 칠해져 있는

    부분은 PU가 현재 채널을 사용하고 있는 BUSY상태를

    나타낸 것이다. IDLE 상태일 때는 SU가 해당 채널을

    사용할 수 있지만 BUSY 상태일 때는 PU로의 간섭을

    막기 위해 해당 채널을 사용하지 않고 다른 채널로 옮

    겨야만 한다.

    표 2는 A와 B 기기에 할당된 채널 호핑 시퀀스를 나

    타낸다. A와 B는 각각 두 개의 송수신기(a1, a2, b1, b2)

  • 의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning 기반의 기회적 채널 호핑 기법 225

    그림 2 채널 상태

    Fig. 2 Channel Status

    표 2 채널 호핑 시퀀스

    Table 2 Channel hopping sequence

    A B

    Transceiver a1 a2 b1 b2

    Channel

    Sequence

    T1 3 4 1 4

    T2 2 4 3 4

    T3 1 4 2 4

    T4 2 3 4 3

    T5 3 2 1 3

    T6 3 1 4 3

    그림 3 두 개의 송수신기를 사용한 채널 호핑 기법

    Fig. 3 Channel hopping scheme using two transceivers

    를 가지고 있고, 각각의 송수신기는 서로 다른 채널 호

    핑 시퀀스를 가지고 있다. 가지고 있는 채널 호핑 시퀀

    스를 사용하여 송수신기들은 서로 통신하기 위해 채널

    호핑을 수행한다.

    그림 3은 표 2의 채널 호핑 시퀀스를 이용하여 채널

    호핑을 수행하는 것을 보여준다. (an, bm)은 송수신기 an

    과 bm이 통신하는 것을 보여준다(n과 m은 1 또는 2).

    시간 T1에 송수신기 a1은 채널 3, b1은 채널 1, a2와 b2

    는 채널 4를 선택한다. a1과 b1은 선택한 채널에 통신할

    상대편이 없어서 통신을 할 수 없지만 a2와 b2는 채널 4

    에서 서로 만났기 때문에 통신할 수 있다. 시간 T2에서

    는 a1은 채널 3에서 채널 2로, b1은 채널 1에서 채널 3

    으로 이동한다. a2와 b2는 채널 4에서 계속 통신한다. a1

    은 채널 2를 선택했지만 통신할 수 있는 다른 기기가

    없기 때문에 통신할 수가 없다. b1 역시 채널 3에서 통

    신할 수 있는 다른 기기가 없기 때문에 통신하지 않는

    다. 시간 T3에는 a1은 채널 1, b1은 채널 2를 선택하고,

    채널 4는 PU가 사용하기 때문에 a2와 b2의 통신은 끊어

    지게 된다. T4에는 a1은 채널 2를, a2는 채널 3을, b1은

    채널 4를 선택하고 b2는 채널 2를 선택하게 된다. 채널

    2에서 a1과 b2가 만났지만 PU가 사용하고 있기 때문에

    서로 통신할 수 없다. 시간 T5에는 a1과 b2가 채널 3에

    서 만나 통신한다. 시간 T6에는 a2는 채널1, b1은 채널 4

    를 선택하고 a1과 b2는 채널3에서 계속 통신한다.

    3.3 Q-learning을 사용한 Opportunistic 채널 호핑

    본 절에서는 본 논문에서 제안하는 Q-learning 기반

    의 채널 호핑 알고리즘에 대해 설명한다.

    본 논문은 먼저 표 3과 같이 Q-learning 기반 채널 호

    핑 기법의 요소에 대해서 정의하였다. State는 현재 채널

    의 상태를 나타낸다. 현재 채널의 상태는 BUSY와 IDLE

    이 있으며 BUSY는 채널이 PU나 다른 기기들로 인해 사

    용 되고 있음을 나타내고 IDLE은 채널이 지금 아무도 사

    용하고 있지 않은 유휴 채널임을 나타낸다. Action에는

    HOP CHANNEL과 HOLD CHANNEL이 있다. HOP

    CHANNEL은 다른 채널로 이동하는 것이고, HOLD

    CHANNEL은 현재 채널에 머물러 있는 것이다.

    표 3 Q-learning 기반 채널 호핑 기법의 요소

    Table 3 Properties of Q-learning based opportunistic

    channel hopping algorithm

    Content Description

    State

    BUSYChannel is used by PU or

    other device

    IDLEChannel is not

    used (free)

    Action

    HOP CHANNELDevice move to

    other channel

    HOLD CHANNELDevice hold current channel

    (doesn’t move)

    Reward

    Sum of cost for channel

    sensing(A), channel

    hopping(B) and

    transmitting(C)

    Q-value Q(s,a)Reward for any

    State-Action Pair

    제안하는 Q-learning 기반 채널 호핑 알고리즘은 알

    고리즘1과 같다. 먼저 상태 이동 함수와 보상 함수를 초

    기화 한다. 상태 이동 함수는 상태(BUSY, IDLE)와 행

    동(HOP CHANNEL, HOLD CHANNEL) 쌍으로 나타

    난다. 아답터와 에이전트는 Q table에 따라서 채널 호핑

    수행을 반복한다. 채널 호핑을 수행함에 따라 보상값(R)

    이 계산된다. 보상값은 채널 센싱(), 전송(), 채널

    호핑( )에 대한 비용이 가중치에 따라 계산된다. 계산

    된 보상값은 learning rate (r)와 다음 상태에서 가장 큰

    Q value (maxa, Q(s', a'))와 함께 Q-learning 수식을

    통해 새로운 Q value로 계산된다. 계산된 Q value는 Q

    table에 업데이트 된다.

  • 226 정보과학회논문지 : 정보통신 제 40 권 제 4 호(2013.8)

    그림 4 제안하는 기법의 시퀀스 다이어그램

    Fig. 4 Sequence Diagram of the proposed scheme

    그림 5 M2M 네트워크와 서비스 자율관리 시스템

    Fig. 5 Autonomic Management System for M2M Networks and Services

    알고리즘 1 제안하는 Q-learing을 사용한 채널 호핑 기법

    Alg. 1 Proposed Q-learning-based channel Hopping scheme

    그림 4와 같이 에이전트와 아답터는 채널 호핑 시퀀스

    를 랜덤으로 생성한다. 또 매니저는 Q-table을 초기화

    한다. 아답터와 에이전트는 생성한 채널 호핑 시퀀스에

    따라 채널 호핑을 수행한다. 이 때, 같은 타임 슬롯에서

    아답터와 에이전트가 만났을 때 서로 데이터를 전송한다.

    아답터와 에이전트는 채널 호핑과 전송에 대한 보상 값

    을 매니저에게 전송하고 매니저는 수신한 보상 값을 가

    지고 Q-learning 알고리즘을 통해 학습한다. 학습을 통

    해 생성된 Q-table을 아답터와 에이전트에게 전송한다.

    4. 구현 및 성능평가

    Q-learning 기반 opportunistic 채널 호핑을 구현하여

    그림 5의 자율 관리 시스템[11-13]의 Agent와 Adapter

    의 통신에 적용하였다. 에이전트는 환자들의 상태를 감

  • 의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning 기반의 기회적 채널 호핑 기법 227

    그림 6 MBAN-CH-QL의 클래스 다이어그램

    Fig. 6 Class diagram of MBAN-CH-QL

    지하는 의료기기들이고 아답터는 의료기기들이 센싱한

    정보들을 수집하여 매니저로 전달하는 게이트웨이다. 에

    이전트와 아답터는 서로 통신하기 위해 매 시간마다 각

    자의 채널 호핑 시퀀스에 따라 채널 호핑을 수행한다.

    매니저는 Q-learning 알고리즘을 수행하여 Q-table을

    갱신하고 최적화된 채널 호핑 시퀀스를 생성한다.

    매니저는 생성한 채널 호핑 시퀀스를 아답터와 에이

    전트에게 전송하고 아답터와 에이전트는 최적화된 채널

    호핑 시퀀스에 따라 채널 호핑을 수행한다. 위와 같은

    요구사항을 가지고 그림 6과 같이 MBAN-CH-QL을

    구현하였다. MBAN-CH-QL은 자바로 작성되었고 Q-table

    을 저장하는 데이터 베이스는 MySQL을 사용하였다.

    본 논문에서 구현한 프로그램을 이용하여 두 개의 송

    수신기를 사용하는 기법과 하나의 송수신기를 사용하는

    기법의 전력 소모와 통신 지연을 비교 측정하였다. 그림 7

    은 PU의 수에 따라 하나의 송수신기를 사용했을 때와

    두 개의 송수신기를 사용할 때의 전력 소모를 그래프로

    나타낸 것이다. PU의 수가 증가할수록 채널 호핑이 많

    이 수행되고 그만큼 센싱 횟수가 많아짐으로 인해 전력

    소모가 점점 늘어난다. 또한 하나의 송수신기를 이용하

    여 통신할 때 보다 두 개의 송수신기를 이용하여 통신할

    때 더 많은 전력이 소비된다. 그림 8은 PU의 수에 따라

    하나의 송수신기를 사용했을 때와 두 개의 송수신기를

    그림 7 PU의 개수당 소모하는 전력

    Fig. 7 Power consumption per PU

    사용할 때의 통신 지연을 그래프로 나타낸 것이다. 하나

    의 송수신기를 이용하여 통신할 때 보다 두 개의 송수신

    기를 이용하여 통신할 때 더 통신 지연이 적다. 그림 9

    는 Q-learning을 수행하였을 때 통신 성공률을 나타낸

    것이다. Q-learning을 수행한 초반에는 축적된 데이터가

    없어서 통신 성공률이 좋지 않았지만 시간이 흐름에 따

    라 축적된 데이터를 통해 학습하여 점점 통신 성공률이

    증가 하다가 일정해 짐을 알 수 있다. 초반에 그래프가

    불안정한 이유는 학습에 의한 성공률 증가보다 완전한

  • 228 정보과학회논문지 : 정보통신 제 40 권 제 4 호(2013.8)

    그림 8 PU의 개수당 발생하는 통신 지연

    Fig. 8 Communication delay time per PU

    그림 9 Q-learning의 통신 성공률

    Fig. 9 Success rate of Q-learning

    학습 이전의 우연성으로 인한 것으로 생각된다. r은 learning

    rate로 r이 1에 가까워질수록 통신 성공률이 일정해지는

    데에 적은 시간이 소비됨을 알 수 있다.

    5. 결 론

    MBAN(Medical Body Area Network) 주파수 대역

    (2,360-2,400MHz)은 PU의 간섭으로부터 다른 대역보다

    비교적 자유로운 대역이다. MBAN을 통해 의료 통신

    산업이 더욱 더 발전하고 의료비 절감을 통해 경제적으

    로 발전할 수 있다. 한국에서도 해당 주파수는 도서 통

    신 주파수로 잡혀있기 때문에 충분히 MBAN으로 사용

    할 수 있다.

    본 논문에서는 MBAN(Medical Body Area Network)

    환경에서 의료 기기들이 서로 통신하기 위해 채널 호핑

    을 수행할 때, 두 개의 송수신기의 사용과 강화 학습 중

    하나인 Q-learning을 적용하여 통신의 지연을 줄이는

    기법을 제안하였다. 두 개의 송수신기를 이용하여 서로

    간에 같은 채널에서 만날 확률을 증가시켰고, Q-learning

    을 통해 학습하면서 PU가 사용하지 않는 IDLE한 채널

    을 사용함으로 통신간의 지연을 감소시켰다.

    두 개의 송수신기의 이용은 많은 전력 소비를 가져온

    다. 많은 전력을 소비하는 것이 문제가 되는 이유는

    MBAN 환경에서의 에이전트들은 대부분 환자의 몸에

    부착된 생체 센서들이고, 일반적인 생체 센서들은 작아

    서 공급할 수 있는 전력의 양이 많지 않기 때문이다. 이

    를 해결하기 위해서는 하나의 송수신기에서 다중 채널

    을 사용하는 기법을 생각할 수 있다. 하지만 현재 하나

    의 송수신기에서 다중 채널을 사용하는 것은 두 개의

    채널을 동시에 사용할 수 없다는 단점이 있다. 따라서

    전력 소비 및 비용 감소와 통신 지연 감소를 동시에 고

    려할 수 있는 기법에 대한 연구가 추가적으로 진행될

    필요성이 있다.

    References

    [ 1 ] Jianfeng Wang, M. Ghosh and K. Challapali,

    "Emerging Cognitive Radio Applications: A

    Survey," IEEE Communications Magazine, vol.49,

    no.3, pp.74-81, Mar. 2011.

    [ 2 ] R. Doost-Mohammady and K.R. Chowdhury, "Trans-

    forming healthcare and medical telemetry through

    cognitive radio networks," IEEE Wireless Com-

    munications, vol.19, no.4, pp.67-73, Aug. 2012.

    [ 3 ] S. Feng, Z. Liang and D. Zhao, "Providing tele-

    medicine services in an infrastructure-based cogni-

    tive radio network," IEEE Wireless Communica-

    tions, vol.17, no.1, pp.96-103, Feb. 2010.

    [ 4 ] P. Phunchongharn, E. Hossain, D. Niyato, S. Camor-

    linga, "A cognitive radio system for e-health app-

    lications in a hospital environment," IEEE Wire-

    less Communications, vol.17, no.1, pp.20-28, Feb.

    2010.

    [ 5 ] J. Gozalvez, "Spectrum for Medical Area Body

    Networks [Mobile Radio]," IEEE Vehicular Tech-

    nology Magazine, vol.7, no.3, pp.11-17, Sep. 2012.

    [ 6 ] R. Chavez-Santiago, K.E. Nolan, O. Holland, L.

    De Nardis, J.M. Ferro, N. Barroca, L.M. Borges,

    F.J. Velez, V. Goncalves, I. Balasingham, "Cogni-

    tive radio for medical body area networks using

    ultra wideband," IEEE Wireless Communications,

    vol.19, no.4, pp.74-81, Aug. 2012.

    [ 7 ] C. Cordeiro and K. Challapali, "C-MAC: A Cog-

    nitive MAC Protocol for Multi-Channel Wireless

    Networks," Proc. of the DySPAN 2007. 2nd IEEE

    International Symposium on New Frontiers in Dy-

    namic Spectrum Access Networks, DySPAN 2007,

    pp.147-157, 17-20, Apr. 2007.

    [ 8 ] X. Zhang and H. Su, "CREAM-MAC: Cognitive

    Radio-EnAbled Multi-Channel MAC Protocol Over

    Dynamic Spectrum Access Networks," IEEE

  • 의료 신체 영역 네트워크에서 통신지연 감소를 위한 Q-Learning 기반의 기회적 채널 호핑 기법 229

    Journal of Selected Topics in Signal Processing,

    vol.5, no.1, pp.110-123, Feb. 2011.

    [ 9 ] A.D. Domenico, E.C. Strinati and M.-G. Di

    Benedetto, "A Survey on MAC Strategies for Cog-

    nitive Radio Networks," IEEE Communications

    Surveys & Tutorials, vol.14, no.1, pp.21-44, First

    Quarter 2012.

    [10] C. Lee, J. Lin, K. Feng and C. Chang, "Design

    and Analysis of Transmission Strategies in Channel-

    Hopping Cognitive Radio Networks," IEEE Trans-

    actions on Mobile Computing, vol.11, no.10, pp.1569-

    1584, Oct. 2012.

    [11] Christopher J.C.H Watkins, Peter Dayan, "Q-

    learning," Machine learning, 1992.

    [12] R. Kamal, M. Siddiqui, R. Haw and C.S. Hong,

    "A Policy Based Management Framework for

    Machine to Machine Networks and Services,"

    Proc. of the 13th Asia-Pacific Network Operations

    and Management Symposium(APNOMS2011), Sept.

    2011.

    [13] R. Kamal, C.S. Hong, "mban-ch-ql (A Q-learning-

    based Autonomic Controller for Channel Hopping

    using MBAN (Medical Body Area Network) Stan-

    dard)," [Online]. Available: http://code.google.com/

    p/mban-ch-ql/

    [14] C.S. Hong, R. Kamal, S.H. Shin, S.I. Moon, R.

    Haw, "Software Design Description-V5.0-Autono-

    mic Management of M2M Networks and Services,"

    [Online]. Available: http://networking.khu.ac.kr/m2m/

    sddv5.docx

    신 승 환

    2011년 2월 경희대학교 컴퓨터공학과

    (공학사). 2013년 2월 경희대학교 컴퓨터

    공학과(공학석사). 관심분야는 Cognitive

    radio, Machine learning, Opportunistic

    Channel Hopping

    로씨카말

    2009년 8월 Department of Computer

    Science Engineering, University of

    Dhaka(공학사). 현재 경희대학교 컴퓨터

    공학과의 박사과정. 관심분야는 wireless

    communication, body sensor network,

    telemedicine, machine to machine com-

    munication, and policy-based network management

    홍 충 선

    1983년 경희대학교 전자공학과(공학사)

    1985년 경희대학교 전자공학과(공학석사)

    1997년 Keio University, Department

    of Information and Computer Science

    (공학박사). 1988년~1999년 한국통신통

    신망연구소 수석연구원/네트워킹 연구실

    장. 1999년~현재 경희대학교 컴퓨터공학과 교수. 관심분야는

    인터넷 서비스 및 망 관리구조, 미래인터넷, IP mobility,

    Sensor Networks, Network Security

    최 종 원

    1984년 2월 서울대학교 컴퓨터공학과

    (공학사). 1984년 2월 서울대학교 컴퓨터

    공학과(공학석사). 1992년 12월 미국 노

    스웨스턴 대학교 EECS(공학박사). 1993

    년~현재 숙명여자대학교 교수. 관심분야

    는 분산 네트워크 프로토콜, 라우팅 및

    멀티캐스트, 미래 인터넷 기술, 네트워크 보안, 인터넷 윤리

    및 정책