Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Intelligent Data Systems
Laboratory
지능형데이터시스템연구실
이상구교수
서울대학교컴퓨터공학부
2IDS Lab.
Intelligent Data Systems Laboratory
데이터 기반의 지능형 컴퓨팅 기술 및 응용 시스템
Natural Language Processing
‐ 자연 언어의 문법 구조, 의미 관계 등을 추론하여 자연어 문장에 대한 효율적인 의미 표현을 얻는 방법에 관한 연구
‐ 시스템과 상호작용하는 대화형 발화 시스템에서 사용자 자연 발화를 이해하는 자연어 이해 기술 개발
Fashion Recommendation
‐ 온라인에서 수집한 패션 상품의 이미지, 카테고리, 태그 등 다양한 정보를 이용하여 패션에 특화된 추천 기술 개발
‐ 이미지 데이터만으로 사람이 인지 가능한 속성들을 분리하고 이를 이용해 이미지를 생성해내는 방법 연구
Big Data & Machine Learning
‐ 슈퍼 컴퓨터를 이용한 대규모 데이터 처리와 기계학습 기술 연구
‐ 빅데이터에 효과적인 스트림 데이터 처리 기법 연구
http://ids.snu.ac.kr
‐ 서울대 컴퓨터공학부 교수 (1992~현재)
‐ 서울대 빅데이터연구원 부원장(2014~2018)
‐ 서울대 정보화본부장 (2012~2014)
‐ 서울대-삼성전자 SW 공동연구센터장(2012~2014)
주 요 경 력
학 력
‐ Ph.D., Computer Science,
Northwestern University
‐ M.S. Computer Science,
Northwestern University
‐ B.S. Computer Science & Statistics,
Seoul National University
이상구 교수
3IDS Lab.
지능형추천
▪ 무한선택지!
▪ 추천기술
매출의 35%가추천을 통한 매출
대여되는 영화의2/3이 추천 경유
38% 이상의 조회수가추천 경유
Digital Contents E-Commerce Social Networks
4IDS Lab.
패션검색
패턴/디테일Color소재스타일 내재적요소
스타일벡터 (개념예시)
StyleNet
(스타일벡터추출딥러닝네트워크) *
✓ 패션아이템이미지에서미세한스타일속성을인지하는딥러닝기술
Vector Similarity
Color Similarity
5IDS Lab.
패션추천
▪ 어울림!
▪ 초개인화
6IDS Lab.
자연어처리
▪ “All grammars leak!” – Edward Sapir
• Korean History teacher
• The boy saw the man on the mountain with the telescope.
• 사랑한다너를나는.
• 아버지가방에들어가신다.
• 할아버지께서그일을하시었겠더구나.
• 그사람이그분에게그렇게하셨다는거지
▪ 다양한활용성
7IDS Lab.
한국어형태소분석기술
▪ 꼬꼬마 (KKMA)
• http://kkma.snu.ac.kr
▪ 띄어쓰기오류에강건하고정교
▪ Versions
• 1.0: 규칙기반형태소분석기
• 2.0: HMM 기반형태소분석기
• 3.0: 분석속도, 메모리사용량개선
• 4.0: CRF(+RNN) 기반형태소분석기
“그땐단지 IMF라는것이나쁜거구나라고만생각했지그것이정확히무엇인지몰랐습니다.”
[그/MMT]
[때/NNB+에는/JKB]
[단지/MAG]
[IMF/OL+이/VCP+라는/EC]
[것/NNB+이/JKS]
[나쁘/VA+ㄴ/ETM]
[거/NNB+이/VCP+구나/EFI+/SS+라고/JKQ+만/JX]
[생각/NNG+하/XSV+었/EPT+지/EC]
[그것/NP+이/JKS]
[정확히/MAG]
[무엇/NP+이/VCP+ㄴ지/EC]
[모르/VV+았/EPT+습니다/EFN+./SF]
8IDS Lab.
챗봇기술
Annotated Text
QA QueryAnswer
Utterance Frame
Intention Analyzer
• Utterance Embedding
• Intention Type Classification
• Slot Identification
Text Preprocessing
• Normalization
• Tokenization
• POS and NER
Action Manager
• Natural Language
Generation
• Client Manipulation
• Triple Retrieval
• Answer Formulation• Deep Search
• Machine Comprehension
QA Engine
Action Plans
User Interaction
(Speech, Image, Text etc.)
Utterance
Dialogue Manager
• Utterance Frame Validation
• State Frame Definition
Retrieval
• State Frame Management
• Function Specification
HandlerState FrameDefinitions
홍길동한테
전활걸어줘
9IDS Lab.
연 락 처
‐ Phone. +82-2-880-5517
‐ Email. [email protected]
‐ Webpage. http://ids.snu.ac.kr/
‐ Location.서울대학교 관악캠퍼스301동 420호 / 138동 418호
‐ 글로벌인터넷빅텍스트데이터실시간모니터링, 한국연구재단 (2016.11 ~)
‐ Multi-modal generative model, 삼성전자 (2015.5 ~)
‐ 지능형음성인식을위한 Q&A 기술선행연구, 현대자동차 (2017.4 ~)
‐ 패션트랜드통합분석을위한시각지능기술, IntelliSys (2018.10 ~)
연 구 과 제 - 진 행 중
최 근 논 문
Natural Language Processing
‐ Kang Min Yoo*, Taeuk Kim*, Sang-goo Lee; Don’t Just Scratch the Surface: Enhancing Word Representations for
Korean with Hanja. EMNLP 2019
‐ Jihun Choi, Taeuk Kim, and Sang-goo Lee; A Cross-Sentence Latent Variable Model for Semi-Supervised Text
Sequence Matching. ACL 2019
Fashion Recommendation
‐ Hanbit Lee, Sang-goo Lee; Fashion Attributes-to-Image Synthesis Using Attention-based Generative Adversarial
Network; WACV 2019
‐ Holim Lim, Jeeseung Han, Sang-goo Lee; SisterNetwork: Enhancing Robustness of Multi-label Classification with
Semantically Segmented Images; IMCOM 2019
Big Data Processing
‐ Kang Min Yoo, Youhyun Shin, Sang-goo Lee; Data Augmentation for Spoken Language Understanding via Joint
Variational Generation. AAAI 2019
‐ Jonghem Youn, Junho Shim, Sang-goo Lee; Efficient Data Stream Clustering With Sliding Windows Based on
Locality-Sensitive Hashing; IEEE Access, Volume 6, pp. 63757--63776, 2018
Intelligent Data Systems Laboratory http://ids.snu.ac.kr
Intelligent Data Systems
Laboratory
지능형데이터시스템연구실
이상구교수
서울대학교컴퓨터공학부