34
엑소브레인 자연어 질의응답 기술 김현기 언어지능연구그룹, 한국전자통신연구원

엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

엑소브레인자연어질의응답기술

김현기

언어지능연구그룹 한국전자통신연구원

2017 ETRI All Rights Reserved 2

1 엑소브레인의 지능은

2 엑소브레인의 성장과 현재

3 엑소브레인의 미래

다시 시작된 인공지능을 제대로 이해하려면hellip

2017 ETRI All Rights Reserved 3

인간의지능 = 학습능력 + 문제해결능력

bull 다중지능 다수의지능들은항상서로교류하면서작용

(Howard Gardner 1983)

그리고 제4차산업혁명 = 연결 + 융합

bull 세계경제포럼(WEF) 물리적 디지털적 생물학적영역간

경계를모호하게하는기술들의융합으로인한변화

인공지능에대한총체적접근필요

bull 초연결 + 초지능 + 초실감

인간의 지능 언어를 통한 학습과 기억

2017 ETRI All Rights Reserved 4

bull 학습과기억 소리-이미지-개념의동시에인지되며 4개의감각이미지가작동

bull 뇌의 1 파악 1000억개가 넘는신경세포와이들이연결된시냅스

bull 기계의인공신경망 인간두뇌가보유한능력중기계로구현할수있는분야

두뇌의 리버스 엔지니어링

2017 ETRI All Rights Reserved 5

ltBlue Brain Project - Brain Waves Simulation(출처 유튜브 20137)gt

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 2: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

2017 ETRI All Rights Reserved 2

1 엑소브레인의 지능은

2 엑소브레인의 성장과 현재

3 엑소브레인의 미래

다시 시작된 인공지능을 제대로 이해하려면hellip

2017 ETRI All Rights Reserved 3

인간의지능 = 학습능력 + 문제해결능력

bull 다중지능 다수의지능들은항상서로교류하면서작용

(Howard Gardner 1983)

그리고 제4차산업혁명 = 연결 + 융합

bull 세계경제포럼(WEF) 물리적 디지털적 생물학적영역간

경계를모호하게하는기술들의융합으로인한변화

인공지능에대한총체적접근필요

bull 초연결 + 초지능 + 초실감

인간의 지능 언어를 통한 학습과 기억

2017 ETRI All Rights Reserved 4

bull 학습과기억 소리-이미지-개념의동시에인지되며 4개의감각이미지가작동

bull 뇌의 1 파악 1000억개가 넘는신경세포와이들이연결된시냅스

bull 기계의인공신경망 인간두뇌가보유한능력중기계로구현할수있는분야

두뇌의 리버스 엔지니어링

2017 ETRI All Rights Reserved 5

ltBlue Brain Project - Brain Waves Simulation(출처 유튜브 20137)gt

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 3: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

다시 시작된 인공지능을 제대로 이해하려면hellip

2017 ETRI All Rights Reserved 3

인간의지능 = 학습능력 + 문제해결능력

bull 다중지능 다수의지능들은항상서로교류하면서작용

(Howard Gardner 1983)

그리고 제4차산업혁명 = 연결 + 융합

bull 세계경제포럼(WEF) 물리적 디지털적 생물학적영역간

경계를모호하게하는기술들의융합으로인한변화

인공지능에대한총체적접근필요

bull 초연결 + 초지능 + 초실감

인간의 지능 언어를 통한 학습과 기억

2017 ETRI All Rights Reserved 4

bull 학습과기억 소리-이미지-개념의동시에인지되며 4개의감각이미지가작동

bull 뇌의 1 파악 1000억개가 넘는신경세포와이들이연결된시냅스

bull 기계의인공신경망 인간두뇌가보유한능력중기계로구현할수있는분야

두뇌의 리버스 엔지니어링

2017 ETRI All Rights Reserved 5

ltBlue Brain Project - Brain Waves Simulation(출처 유튜브 20137)gt

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 4: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인간의 지능 언어를 통한 학습과 기억

2017 ETRI All Rights Reserved 4

bull 학습과기억 소리-이미지-개념의동시에인지되며 4개의감각이미지가작동

bull 뇌의 1 파악 1000억개가 넘는신경세포와이들이연결된시냅스

bull 기계의인공신경망 인간두뇌가보유한능력중기계로구현할수있는분야

두뇌의 리버스 엔지니어링

2017 ETRI All Rights Reserved 5

ltBlue Brain Project - Brain Waves Simulation(출처 유튜브 20137)gt

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 5: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

두뇌의 리버스 엔지니어링

2017 ETRI All Rights Reserved 5

ltBlue Brain Project - Brain Waves Simulation(출처 유튜브 20137)gt

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 6: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인공지능에 대한 진보와 보수적 의견

2017 ETRI All Rights Reserved 6

지능은 오직 생명의 것마음을 지닌 기계의 탄생

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 7: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

기계의 지능 AI

2017 ETRI All Rights Reserved 7

인공지능 (AI) Science and engineering of making intelligent machines (John McCarthy 1955)

①약한인공지능 Weak AI Artificial Narrow Intelligence

②강한인공지능 Strong AI Full AI Artificial General Intelligence

bull Nick Bostrom(2014) 인간지능의2022년10 2040년50 2075년90 가능성

③초인공지능 Artificial Super Intelligence (AI Revolution The road to superintelligence)

bull Ray Kurzweil(2006) BBC(2013) 등은 2045년특이점(Singularity) 도래예측

lt그림출처 디지털타임스 (20174)gt

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 8: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인공지능기술 개발 사례

2017 ETRI All Rights Reserved 8

bull IBM Watson 컴퓨터 제퍼디 쇼 우승(2011)- Power 750 9대 (2880 코어 16TB 메모리)

- 200억 페이지 4단계 추론

bull 구글 Brain (X-Project) (2012) - 9 계층의 Deep 뉴럴 네트워크 고양이 인식(74)- 유투브 이미지영상 랜드마크 자동 인식 서비스

bull Google AlphaGo (2016)- 인공신경망 기반 Value and policy networks- 이세돌 9단과 대결에서 승리(20163)

bull DARPAIBM SyNAPSE Project(2013)- 뇌 시뮬레이션 뉴로모픽칩 시스템 구조 등- 목표 100억 개 뉴론 100조개 시냅스 연결

언어 지능 시각 지능

학습 지능 뇌인지 컴퓨팅

Prototype of IBM Cognitive Computer 응용 해파리로봇-해양안전

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 9: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인공지능의 총체적 접근 1 ndash 핵심요소 및 성장단계

2017 ETRI All Rights Reserved 9

bull 알고리즘 머신러닝 딥러닝 강화학습 hellip

bull 빅데이터 방대한학습데이터

bull 컴퓨팅인프라 분산처리 GPU

bull 창의성

ldquo로켓을 만들려면 로켓 엔진과 이 로켓 엔진을 구동시킬연료가 필요합니다 딥 러닝이 로켓이라면 대규모 뉴럴 네트워크는 엔진이고 대량의 데이터는 연료입니다 두 가지가 공존해야만 딥 러닝이 가능한 것이죠rdquo(Andrew Ng 엔비디아 GTC 2015)

③초인공지능

②강한인공지능

①약한인공지능(AI 20)

알고리즘

컴퓨팅빅데이터

창의성

①약한인공지능(AI 10)

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 10: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인공지능의 총체적 접근 2 ndash 연결과 융합

10

언어 말 글

lt듣기 음성인식gt

lt말하기 음성합성gt

lt읽기 언어이해gt

lt쓰기 언어생성gt

= +

수치시각

hellip

+

2017 ETRI All Rights Reserved

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 11: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

엑소브레인의 지능은

전문가와지식소통이가능한인공지능SW개발 지식 산업환경에서 전문가 수준의 질의응답(Question Answering)을 통한 지식 서비스 제공

무배당 신바람 건강보험에가입했습니다 신장결석으로

충격파쇄석수술을 했는데 수술시보험금 지급이 가능한가요

Question Answeringbull 금융민원 등 전문지식 상담

Smart Advisorbull 전문직종 의사결정 지원

Decision Supportbull 법률특허 등의 전문가 판단 지원

Thinking Machinebull 지능형 단말의 인공두뇌로 활용

착륙예정점에 대한 경사각 수직면유도 결함의 정비 항목은

Edward Fox was diagnosed with type 2 diabetes last

year What are good medications for him

이 특허출원서와 중복되는선행특허는

자연어 심층이해 자연어 지식 생산

자연어 질의응답

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 12: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

국내외 연구동향

2017 ETRI All Rights Reserved 12

정부와 기업에서 지능형 QA을 위한 대규모 인공지능 프로젝트 진행

- 정부 AQUAINT QA 프로젝트 IBM Waston 구글 지식그래프

AQUAINT Advanced Question Answering for Intelligence

2021년 동경대 입시 합격 가능한 인공지능 프로젝트 진행 포기(lsquo16년)

- 토다이 로봇 국립정보과학연구소 슈퍼컴 활용 2011~2021년 진행

지경부는 빅데이터 및 인공지능을 SW 핵심기술로 선정(12년 4월)

- 2013년 국가혁신 기술개발형 엑소브레인 SW 과제 시작

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 13: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

기술동향 amp 연구 방법론 앙상블 QA 지향

2017 ETRI All Rights Reserved 13

bull IBM Watson 비정형 지식베이스 위주 IR 기반의 QA- 질문 여러 개의 문장으로 구성된 복잡한 질문- 정답 비정형 지식에서 62 정형 지식에서 22 찾음

bull Google Knowledge Graph 정형 지식베이스 위주 KB 기반의 QA- 질문 한 개 문장 제한된 문형의 단순한 질문- 정답 질문의 객체와 매칭되는 지식그래프의 단순사실 정보 제공

비정형 지식베이스 691 정형 지식베이스 22 bull 객체 5억 7천만개bull 사실 180억개

ltIBM Watsongt ltGoogle Knowledge Graph gt

bull 지식추출 정확률재현율4550 3580

bull 계룡산의 높이는

bull 유성이 타버리지 않고 땅에 떨어진 것은

bull 자연어 QA 시스템을 평가하는 방법은

bull 모든 문제에 대한 명확한 분석 및 표현 불가

- IBM 왓슨 질문의 11는 정답유형 결정 불가

bull 모든 정답을 사전에 정형화된 지식으로 구축 불가

- 지식 선언적 지식 절차적 지식 경험적 지식 등

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 14: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

KB-based Deductive QA 신뢰성 gt 커버리지

2017 ETRI All Rights Reserved 14

bull Q 계룡산[entity]의높이[property]는

bull Conclusion must be true if all premises are true

bull 도전기술bull 표현의다양성 Partial parsing

bull 계룡산은얼마나높나요bull 계룡산의높이는

bull Entity Property disambiguation amp linkingbull Ontology construction 지식표현커버리지 지식구축신뢰도

계룡산 800mheight

mountain

Entity linking Property linking

Answer Type Number

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 15: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

Data-driven Inductive QA 신뢰성 lt 커버리지

2017 ETRI All Rights Reserved 15

bull Q 오만원권화폐에서신사임당옆에그려져있는과일은bull Evidences

bull (+) 오만원권앞에는신사임당옆에포도가그려져있다

bull (+) 오만원권에있는그림은포도입니다

bull (+) 포도는오만원권지폐에신사임당초상뒤에도안화되어있다

bull (-) 오만원권의뒷면그림으로는매화와대나무가있다

bull Conclusion is probable based on supporting evidences

bull 도전기술bull Linguistic knowledge(eg WordNet FrameNet)

bull Uncertainty processing

bull 오만원권화폐에서신사임당옆에그려져있는것은

bull Deep parsing 어휘문장문맥의이해

bull Paraphrasing

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 16: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

엑소브레인의 단계별 지능화

도전적 원천기술 확보로 시작 글로벌 기술 상용화로 발전201305 201703 202001 202212

1단계(핵심 기술 개발)

IBM 왓슨과 기술격차 7년을4년간 개발하여 단축(사실지식QA 시스템)

2단계(응용 기술 개발)

전문지식 서비스세계적 성능 달성(Smart Advisor)

전문지식 QA 시스템 상용화(예 법률 특허 상담)

3단계(글로벌 기술 개발)

다국어 전문지식 서비스세계 최고 성능 달성

(Thinking Machine)

의사결정 지원 시스템 상용화

엑소브레인 생태계

표준화 추진 SW DB말뭉치

지능형 로봇 QA

정비보조 등 지능적 업무 수행

웨어러블 QA

헬스케어 피트니스 지식 서비스

다국어 지식 QA

다국어 지식서비스 제공

목표및

결과물

기술검증및

사업화

전문지식 QA

법률특허 전문지식 제공

전문분야 컨설팅 QA

전문가 의사결정 지원

지능형 상담 QA

공공 및 기업 고객 상담

기술검증 지식 대결(장학퀴즈 lt대결 엑소브레인gt

압승(rsquo161118))

엑소브레인 인공지능산학연 생태계 구축

엑소브레인의 단계별 지능화

2017 ETRI All Rights Reserved

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 17: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

장학퀴즈 lt대결 엑소브레인gt

2017 ETRI All Rights Reserved 17

EBS장학퀴즈 1021회유튜브동영상 httpswwwyoutubecomwatchv=oj6WYZ7Z-H4

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 18: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

장학퀴즈 lt대결 엑소브레인gt 결과

2017 ETRI All Rights Reserved 18

총 30 문제(600점) = 객관식 10문제(100점) 주관식 10문제(200점) 고난이도주관식 10문제(300점)

엑소브레인 25문제(510점) 차점자 18문제(350점) 맞춤

lt객관식문제gt

lt주관식문제gt

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 19: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

쉬운 문제와 어려운 문제

2017 ETRI All Rights Reserved 19

lt문제의의미를이해하고 답변을동적으로추론해야하는문제gt

lt문제은행구축으로해결가능한문제gt

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 20: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

과제 개념 WiseQA (Wise Question Answering)

2017 ETRI All Rights Reserved 20

문제이해 정답후보 추론 최적정답 추론자연어 질문

정답 근거 정확도자연어 질의응답

자연어 이해 지식 학습 및 축적(123세부과제)

휴먼 피드백

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 21: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

(1) 자연어 심층이해 기술 - 기계가 이해하는 자연어

소피스트란 그리스어로 지혜로운 자 또는 지혜를 만들어내는 사람이라는 뜻으로 BC 5~4세기의 그리스의 철학자들을 말한다 이들은 아테네 사람들을 대상으로 하여 수사학과 웅변술을 가르쳤다

형태소 분석

소피스트NNG+란JX 그리스NNP+어XSN+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP BCSL 5SN+~SO+4SN+세기NNP+의JKG 그리스NNP+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX 아테네NNP 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC 수사NNG+학XSN+과JC 웅변NNG+술XSN+을JKO 가르치VV+었EP+다EF+SF

개체명 인식

의존구문분석

ltCV_OCCUPATION소피스트NNGgt+란JX ltCV_LANGUATE그리스NNP+어XSNgt+로JKB 지혜롭VA+ㄴETM 자NNB 또는MAG 지혜NNG+를JKO 만들VV+어EC+내VX+는ETM 사람NNG+이VCP+라는ETM 뜻NNG+으로JKB+SP ltDT_DURATIONBCSL 5SN+~SO+4SN+세기NNPgt+의JKG ltLCP_COUNTRY그리스NNPgt+의JKG 철학NNG+자XSN+들XSN+을JKO 말NNG+하XSV+s다EF+SF 이NP+들XSN+은JX ltLCP_CAPITALCITY아테네NNPgt 사람NNG+들XSN+을JKO 대상NGG+으로JKB 하VV+아EC ltFD_ART수사NNG+학XSNgt+과JCltFD_ART웅변NNG+술XSNgt+을JKO 가르치VV+었EP+다EF+SF

가르쳤다

하여 웅변술을

수사학과이들은 사람들을 대상으로

아테네

ltSBJgt ltOBJgt ltAJTgt

ltOBJgtltVPgt

ltCNJgt

ltNPgt

ltVPgt말한다

뜻으로 철학자들을

5~4세기 그리스의

BC

사람이라는소피스트란

만들어내는그리스어로 자 또는

지혜를지혜로운

ltOBJgtltAJTgt

ltNP_MODgtltVNP_MODgt

ltAJTgt

ltVP_MODgt

ltNPgt ltAPgt

ltOBJgt

ltSBJgt

ltNPgt

ltVPgt

ltNP_MODgt

ltVP_MODgt

ltTHME대상gt ltTHME대상gt

ltAGENT행동주gt

ltTHME대상gt

ltAGENT행동주gt ltATTR속성gt

ltTHME대상gt

ltTHME대상gt

이들은

ltSBJgt

ltAGENT행동주gt

의미역 인식

상호참조해결

무형대용어생략복원

어휘의미분석 소피스트란 그리스어로 지혜로운 자__18_0000NNB 또는 지혜__02_0001NNG+를 만들__00_0101VV+어내는 사람__00_0001NNG+이라는 뜻__00_0002NNG+으로 BC 5~4+세기__03_0002NNG+의 그리스__02_0000NNP+의 철학자들을 말하__00_0101VV+ㄴ다

문법분석

의미분석

2017 ETRI All Rights Reserved

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 22: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

(2) 언어지식 추출학습구축

도서 12만권분량을자동으로학습하여언어지식으로생산

맵리듀스분산처리기반 6일이내분석가능 (4대사용)

어휘지식베이스(WiseWordNet ) 1677885개어휘

lt어휘 지식베이스gt

lt비정형 언어 지식베이스gt

코어지식

활동

정봉수

조선

직책

직급

임진왜란

의병장

15720000-16450000

기간

무관 국적

선조리더

왕타입

국적

활동지

15670000-16080000

기간

TM_OVERLAP

의병

활동

정기수

지휘

활동

활동

장소정묘호란평안북도

활동

소이벤트

lt시연gt

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 23: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

(3) 단답형 질의응답 기술

자연어 분석과 질문이해 정답후보의 복합추론 최적정답의 추론

bull 자연어 어휘문맥의미의 분석bull 자연어 질문의 다차원 분석bull 정답제약과 질문 시맨틱 프레임 생성

bull 정형비정형 정답후보 생성bull 정답후보의 정답 제약조건 추론bull 정답가설 근거추론 및 정답후보 병합

bull 최적정답 신뢰도 학습bull 최적정답 응답 임계치 학습bull 최적정답 신뢰도 추론 및 검증

Q이것은 정도전이 천하를 다스리는데 부지런해야 하고

안일하지 말아야 왕의 소임을 다하는 것이라는 의미로 이름을 지었다 경복궁에 속한 이 건물의 이름은 무엇일까

A1 근정전 (신뢰도 80)2 광화문 (신뢰도 5)3 강녕전 (신뢰도 1)

Logic-based WiseQA[1] 질문은 정답을 추론하고 제약하는 조건들을 포함한다[2] 정답은 질문에서 분석된 모든 조건들을 lsquo참rsquo(True)으로 충족시켜야 한다[3] 문제를 풀 수록 정답과 오답을 더욱 정확하게 판별해야 한다

2017 ETRI All Rights Reserved

lt시연gt

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 24: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

엑소브레인의 현재 성과

2017 ETRI All Rights Reserved 24

언어학자 수준의 문법이해 기술과 인간 퀴즈왕 수준의 QA 기술 개발

SW 보급(34건) 머신러닝 학습데이터 보급(153건) 인력양성(464명 석사13명박사4명 배출)

IPR 확보 국제표준 2건(표준특허 7건) 국내표준 4건

자연어 심층이해 기술 등의 상용화(솔트룩스-아담 마인즈랩-마음 인터웍스미디어-온라인 광고)

lt국제 표준 승인 2건(lsquo15 rsquo16)gt

lt머신러닝 학습데이터 보급(lsquo15 rsquo16)gt

lt국내외 언론보도 250여건gt

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 25: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

2017 ETRI All Rights Reserved25

언어의 의미이해의중요성

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 26: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

엑소브레인 오픈API

언어처리 질의응답 API

인공지능 변리사

특허 조사분석 및 심사 자문

인공지능 법률가

법률 판례 소송 등 자문

엑소브레인 생태계

SW 배포 DB 배포 인력양성

전문분야 대상 서술형 질의응답 핵심기술 개발 및 산업화- 전문분야 법률 특허 공공 금융 등 -

엑소브레인의 미래 2단계 개발 목표

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 27: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

독해력이 필요한 질의응답 문제

2017 ETRI All Rights Reserved 27

bull 산소bull httpskowikipediaorgwikiEC82B0EC868C

bull 텍스트

bull 문제난이도bull 상 우주에서두번째로가장많은원소는bull 중 우주에서많이존재하는원소중에서산소의순위는bull 하 물에포함된산소는지각에존재하는산소전체의몇퍼센트를차지하나

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 28: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

법률분야 인공지능 개발동향

2017 ETRI All Rights Reserved 28

리걸테크

IT를활용해법조인(판사 검사 변호사등)의법률검색 업무처리등을보조 또는

일반인의법률자문 판례분석등을도와주는기술및서비스

유망분야 내용 국내외 기술현황

법률 검색법조인이 담당한 입법안 또는 사건 관련된 방대한 법령 판례

논문 등의 검색 서비스

-(미국) ROSS Intelligence (IBM 왓슨 활용) 파산법 관련 법률판례를 분석해 수임사건

에 도움이 될 만한 내용을 제공

-(미국) Westlaw 판례 법령 행정규제 신문논문 등 법률 관련정보 검색 기능 제공

변호사 전문가 등

검색추천고객이 조건에 맞는 변호사를 검색 또는 추천하는 서비스

-(한국) 헬프미 온라인 변호사 검색 기능 및 법률 상담 기능 제공

-(영국) Lexoo 고객의 조건에 맞는 변호사 추천 기능 제공

전자증거개시소송 준비 과정 중 디지털 데이터로부터 증거를 수집하고 분

석하는 서비스

-(미국) Disco 다양한 전자문서에서 정보를 검색 추출 관리하는 기능 제공

-(미국) Logikcull 클라우드 기반으로 디지털 증거를 분석하고 추출하는 기능 제공

법률 자문 및 전략 수립입법 관련 입법안의 통과 가능성 또는 사법관련 소송에서 승

소 가능성 등의 예측분석

-(미국) FiscalNote 입법안의 통과 가능성을 분석하는 프로퍼시(Prophecy) 규제정보를

분석하는 lsquo소나(Sonar) 등을 통해 입법과 관련법령 정보를 분석하여 기업에 제공

-(미국) Lex Machina 데이터 마이닝 기반 법원의 판결 예측분석 기능 제공

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 29: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

4차 산업혁명에서 지식노동의 자동화 단계 - AI 적용 단계

2017 ETRI All Rights Reserved

bull 1단계 보조자수준bull 전문가시스템을하나의보조

자로보는것으로 이들은일상적인분석수행을돕고전문성이필요한작업부분을지적해준다

bull 2단계 동료수준bull 사용자는문제에대하여시스

템과계속해서이야기를함으로써마침내공동결정에이를수있도록돕는다

bull 3단계 전문가수준bull 사용자는시스템을진정한전

문가로보고사용자는시스템의조언을의심할여지없이받아들인다

lt출처 위키피디아gt

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 30: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

장기적 관점에서의 연구와 육성이 중요

2017 ETRI All Rights Reserved 30

bull 대가들의언어처리기술개발에대한발언(Computation Linguistics 2015)

bull Explainable AI 인간이이해못하는인공지능 믿어도되나

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 31: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

기술시장의 환경변화 대응은 - 엑소브레인과 4차 산업혁명

2017 ETRI All Rights Reserved 31

전문가시스템(1순위) 자율로봇(2순위) 지능형가상비서(3순위) 시장선도 출처 TechNavio 2015 BCC리서치 2015

엑소브레인의 4차산업혁명에서적용분야와시기

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 32: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

맺음말

2017 ETRI All Rights Reserved 32

국가와산업에활용가능한인공두뇌개발

2020 2024 2030 2045

Top 10 Strategic Technology Trends for 2014ltGartner 2013gt

Disruptive technologiesltMcKinsey 2013gt

ltTechcast 2013gt Tomorrowrsquos world A guide to the next 150 yearsltBBC 2013gt

스마트머신(스마트자문가 인간의지적노동 10 보조)

지적노동의자동화(5~7조달러경제적가치)

인공지능재조명인간지능을뛰어넘는슈퍼지능머신(확률 10~50)

2011

기계가인간의지적노동 30 대체

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 33: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

인간의지식노동을보조하기위한시작단계

ldquo인간에게어려운일이로봇에게는쉽고

인간에게쉬운일이로봇에게는어렵다rdquo

lt한스모라벡의역설gt

2017 ETRI All Rights Reserved

감사합니다

Page 34: 엑소브레인연어 질의응답기술 - krnet.or.krB1%E8%C7%F6%B1%E2.pdf · ①약한인공지능, Weak AI, Artificial Narrow Intelligence ②강한인공지능, Strong AI, Full

2017 ETRI All Rights Reserved

감사합니다