21
o 1997. 7. 2. [email protected] 1 KRNET'97 - , l n

hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

도:l. o 웹검색엔진

1997. 7. 2.

승현석

삼성전자 기술총괄 소프트웨어센타

[email protected]

1 KRNET'97

소개

·정보

·정보검

·정보검색멘진

• 웹 정보의 특성

웹 정보검색시 고려사항

-

, l

n

μ

Page 2: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

• 가치가있는자료

가공된자료

확실성을제거 혹은감소

l 분석과 확인작업을 거친 첩보

무엇인가? 정보란

” l T ’

’‘ι:o.'~ 무엇인가? 정보검색이란

」-」

차Z

처。 르를

과 보

이l 정

련 한

일 요

피르

• 정보 수집, 분석, 재가공까지의

l 개인이나조직이 의사결정에

일련의과정 듬끼L-른 。{투긍 .A. 0 I 느: ;터 며

n -1 c크 C<:크 | λ.A L- C> ' • 최소한의 비용으로 최대의 수집이목표

” m

“ ”

- 54 -

Page 3: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

--해야흉~ ;'

” m

.... ’--

• 사용자의 질의에 관련된 정보의 존재 여부와 그 위치를알려 줌

• 질의한 정보 그 자체를 알려주는 것은 아님

주식시세, 신문기사, 도서목록 등을 조회하는 단순한 자료검색멘진과는 E

정보검색엔진이.란?

트르A게 --11 C ) 정보의 웹

최종적으로 결론지을 방법 없음

정보의 우수성을 판단하기 어려움

l 정보의 다양성

·정보수집의 신속성

• 멀티미디어 정보

• 체계적이지 못함

·서비스가혼잡

• 신뢰성이 취약

·존재 여부

·찾아낸

” l

야 μ

Page 4: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

웹 정보검색시 고려사항 :-- iAO*' I

정보의 위치를곧바로찾는것 보다해당정보를 제공할 만한 전문 검색멘진을 찾는다

큰개념에서 시작하여 세부적인 내용으로찾아 들어간다

‘못찾는것’과‘원래 없는것’에 대한경계를신중히

결정한다

상용 데이타베이스, 각종 인쇄물, 도서관 목록등을 검색멘진과 혼합하여 사용하는 것이 바람직

-

밝 뻐

웹 검색어|찌。| 이해

·검색방법

l 검색분야

l 검색목적

·검색 수행자

-

밝 빼

- 56 -

Page 5: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

검새박법에 따F 밴류

l 주제별 검색맨진

l 단어별 검색멘진

• 메타검색맨진

• 통합검색맨진

뺨켠j

주제별 검색엔진 Rl(;J .... ‘

• 각 정보를 주제별로 정리하여 사용자로 하여금 단계별로 선택해 들어가 결국 최종 정보에 도달할 수 있도록구성된 검색맨진

l 일명: 디렉토리 서비스, 분류 서비스

• 여I : - 해 외 : Yahoo, Galaxy, VWVVVVirtual Library

- 국내: 애니서치, 코씨크, 심마니, 정보탐정, Zoom, Zip

” l

n “ 1 I

- 57

Page 6: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

주제별 검색엔진 """'. A :1

• Browsing어| 춧점을 두고 있다

• 정보검색의 출발점으로 많이 이용

• 수작업으로 정보를 분류

• 특정 분야만을 전문적으로 분류한검색멘진들이 속출 - 여1: Internet Sleuth

” I ” m

주제별 검색엔진

l 장점 - 찾고자하는정보에 대한사전지식 없이도찾기 용이함

- 해당분야에 관련된 정보들을 한눈에 파악하기 용이함

- 키워드로는찾기 힘든큼지막한정보들을찾는데 편리함

- 키워드로 표현하기에는 너무 일반적이거나 애매할 경우 그 위력을밭휘

η

I -

인 째

- 58

Page 7: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

<<.saJM:‘l ‘ 검색엔진 주제별

드~^1 L...!I=그

- 사람이 분류할 수 있는 데에는 한계가 존재

- 새롭게 올라오고갱신되는정보를사람이 일일히 이를 확인하고분류할수없음

- 한번 잘못된 분류를 따라가면 정보를 제대로 찾지 못함

- 분류의 객관성을 보장하기 힘듬

l m

1

ι

-

""""""" 검색엔진 단어별

나타난단어를 • 해당 정보를 지칭하는 혹은 그 정보에 입력하여 검색하는 검색멘진

• 일명: 키워드 검색멘진, 서치엔진

• 여 I : - 해 외 : AltaVista , Excite , Hotbot, Infoseek, Lycos - 국내: 애니서치, 유니파인더, 웹글라이더, 까치네, 심마니, 정보탐정, 아이봇

-

타 째

M

59 -

Page 8: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

검색엔진 단어별

• Searching어| 춧점을 두고 있다

대개 색인 데이타베이스를 구축, 검색속도를 향상시키고 있음

• 질의 연산자 - A and B

- AorB

- A not B

- “A B" (phrase 검 색 )

T ’ 빠

u n

I

검색엔진 단어별

l 장점 - 원하는 정보툴 빠르게 찾을 수 있음

- 세부적인 정보를 찾는데 용이

- 자료 수집, 색인 구축 등의 과정이 자동화

- 방대한자료검색 가능

단점 - 올바른키워드를사용하지 않을경우검색이 않되거나 너무 많은 정보가검색될 수 있음

- 관련 정보를검색하기 어려움

- 요약정보의 품질이 낮음

” l

I

- 60 -

Page 9: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

단어별 검색엔진

• 검색능력의 변수 -색인자료건수

- 색인 갱신 주기

- 검색 기법

어느 한검색멘진의 속도나 자료가 많다고 하여 그 검색멘진만을사용하게 된다면 다양한정보를접할 수 있는 기회를 스스로 저버리게 됨

η

I 번 째

메타검색엔진

• 하나의 웹 페이지에서 여러 검색멘진에 대한질의 인터페이스를제공

• 일명: 다모아형 검색멘진 AII-in-one 검색멘진

l 이용하고자 하는 검색 멘진을 고르고 검색 키워드

입력

• 정확하게는 검색멘진이 아니고 하나의 거대한 HTML 검색 Form 임

• 여I : - 해오1: CUSI, w3 서치엔진, AII-ln-One 서치페이지

” m

-

-61 -

Page 10: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

메타검색엔진

·장접 - 한곳에서 여러 검색맨진을 활용할수 있음

- HTML로 되어 있어 설치가용이

드~:처 L......!t:그

- 한번에 한개의 검색맨진에서만검색 가능

- 검색맨진의 양식, 질의 문법, 주소 등이 바뀐 경우 검색오류밭생

• 발전된 형태 - 자바스크립트틀 이용 키워드를 한번만 입력 (예: 찾고파)

- 검색엔진을 주제별로 정리 (예: 구골)

” l M n 3 -

통합검색엔진 A1t1UiH 5 ::z

• 여러 검색엔진의 검색결과를 통합하여 보여줌

• 일명: 정보검색 에이전트, 메타검색멘진

• 자체 색인 데이타베이스가 없음

• 여I : - 해 외 : Insane Search, OnRamp, MetaCrawler, Savvy

Search

- 국내: 미스 다찾니

n u ‘ ‘ -

” m M

- 62 -

Page 11: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

통합검색엔진 r

iUCr720'

·장점 - 한 번의 검색으로 많은 검색엔진에서 정보를 얻을 수 있음

• 단점 - 속도가느림

- 다른 검색맨진의 성능에 좌우됨

” l

검색분야에 따른

• 일반검색멘진

·전문검색멘진

-

밝 빼

I

-63-

Page 12: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

일반검색엔진

• 특정한 분야에 편협되지 않고 전세계에 올라 온 자료를검색 가능케 함

l 주제별로 자료를 정리해 놓았거나 키워드로·검색

• 전세계에 걸쳐 분산된 자료를 검색하게 되므로 정보의 질이나 수준을 보장받을 수 없음

• 정보의 다양성, 신속성이 관건

l m m T

• M m

M 1 J

‘ ‘ I

....".’‘a 검색엔진 A:케 프프 I • ,.

정 분야에 대한 전문 검색멘진

• 일반검색멘진에서 검색하기 어려운 정보 검색 가능

자체 서버에 올라오는 정보들만 검색해주는

검색멘진

• 고품질의 정보를 손쉽게 찾을 수 있음

새로운미디어검색 가능

정보의 완정성, 정확성이 관건

” ’

” ”

- 64 -

Page 13: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

전문검색엔진 R훌" .. I

• 여I : - 기 업 : Yello Page, BigBook, SalesLeadsUSA

- 뉴스: NewsPage, NewsTracker

- 쇼 핑 : Price Watch, Computer ESP

- 영 호~: Internet Movie Database (IMDB)

- 지 리 : MapQuest, Xerox Parc Map Viewer

- 영 상: Image Suπer, WebSeer

I l m T

검색목적에 따른 류

l 단순검색

- Hit Search

• 전략적 검색

- Strategic Search

-

t

ι

- 65 -

Page 14: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

;겨 AH E그 I

특정 한 하나의 자료를 찾아내 는 Hit Search

1 회성 검색

주로일반검색멘진을활용

A

T』단

민 빼

l 정보사냥

I

fUW_“ 검색 전략적

호L도요 E르 C그

• 종합적 산업정보 획득과분석을위한검색

• 온라인 시장조사

• 다른 조직보다 경쟁적 우위에

• 장기성 검색 l 포괄적 검색

·검색 보다는분석에 더

오르는데

큰비중을둔다

” m

m m 왜

I

- 66 -

Page 15: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

검색 수행자에 따른 류

RU", '

·직접 검색

·대리검색

I ” l

대리검색 κ·

• 검색맨진의 종류와 숫자가 다양해짐

• 정보검색의 시발접인 검색맨진의 선택에서부터 난관에 부딪힘

l 해결책: - 정보검색 대행업체

- 정보검색 에이전트

빼 - 67 -

Page 16: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

정보검색 대행업체 RRJA I

l 고객이 요청한정보를 여러 매체 및 검색멘진 등을

활용하여 검색을 수행, 그 결과를 보고해 줌

l 개인보다는 주로 기업에서 활용

• 시장 조사, 기술 동향, 논문 검색, 각종 인쇄물 검색

• 검색 기간: 단기성, 장기성

l 상용 데이타베이스를 많이 이용

• 여I : - 해외: 야후의 목록, answers.com - 국내: 장미디어 인터랙티브, 인터넷과컴퓨터

’ ’ 야

정보검색 에이전트

• 사용자를 대신하여 네트워크상의 많은 정보를 검색하고 그 결과를 정리, 보고해주는 전자비서

정보검색 대행업체에서 근무하는 정보검색사의 역할을소프트웨어로구현

l 아직은초보적인 수준

l 차세대 검색도구로 각광받을 것으로 전망

-” m M

I

- 68

Page 17: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

정보검색 에이전트 RR3A1li :'

• 여I : - 통합검색엔진

- Bargainbot Search Agent

- BargainFinder Agent

- Jango

- MX BookFinder

” ’

성공적인 검색엔진의 필수요소

펀리한사용자인터페이스

방대한정보량

l 빠른검색속도

l 데이타베이스의 갱신 주기

• 각종검색 옵션

.찾고자하는정보 르고정확하게 찾아주어야함

” s ” m M

69 -

Page 18: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

성공적인 정보사냥꾼의 필수요건

IiLO~ -1 -, 각검색맨진들의 장단점

• 빠른검색환경 구축 호k5포 E크 〈그 분야별 전문검색멘진

키워드추출능력배양 •

파악 초i트르 며IA내 7'1 드a λ1 -1--듀| 〈그 11 ~ c그 E르 E르 L..! -, '-' 1 정보의

” m

성공적인 정보검색사의 필수요건

• 정보 분석 및 가공 능력 배양

• 전문 검색멘진의 존재 및 위치 파악 능력

l 전문 검색맨진에 대한 리스트를 분야별로 정리, 이를 지속적으로유지 관리

유료데이타베이스활용

각종인쇄물활용

” m

t

ω

-70-

Page 19: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

로 」

켜 르

• 검색멘진의 폭발적인 증가

• 검색맨진의 선택이 정보검색의 성공여부를 판가

l 정보 분석 및 가공 능력의 중요성

• 정보검색 에이전트의 보편화

” 이

I ” m

주 · 고

O' •••• ~

RkJ.CC1 I

• 일반검색엔진 (해외) - Alta Vista (www.altavista.digital.com)

- Excite (www.excite.com)

- Galaxy (galaxy.tradewave.com)

- Hotbot (www.hotbot. com)

- Infoseek (www.infoseek.com)

- Lycos (www.lycos.com)

- WNW Virtual Library (www.w3.org/pub/DataSources/bySubjecUOverview.html)

- Yahoo (www.yahoo.com)

l m

Page 20: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

참7 ̂ ιk .-1 l 일반검색맨진 (국내)

- 애 니 서 치 (WWN. anysearch. com)

- 유니 파인 더 (WWN.unifinder.com)

- 웹 글라이 더 (WWN.infoglider. com)

- 쿄씨 크 (kor-seek. chungnam. ac. kr)

- 까치 네 (WWN.kachi. com)

- 심 마니 (simmany.hnc.net)

- 정보탑정 (idetect. kotel. co. kr)

- 아이 봇 (ib야.iworld. net)

- Zoom (zoom.cyso.net)

- Zip (WWN.zip.org)

” m

l 고

Rk>s ...... “

• 메타검색엔진 - CUSI (WWN.nexor.co.uklsusi/cusi.html) - V\β 서 치 멘 진 (CUiWWN. unige.ch/meta-index. html)

- AII-I n-One 서 치 페 이 지 (WWN.albany. netlallinone/)

- 찾고파 (web.sec.samsung. co. kη-대ee/)

- 구골 (WWN.jmi. co. kηlibrary/googol/)

• 통합검색엔진 - Mamma (WWN.mamma.com)

- OnRamp (search.onramp.net)

- MetaCrawler (WWN.metacrawler.com)

- Savvy Search {guaraldi. cs.colostate.edu:200이

- 미 스 다찾니 (WWN.mochanni.com)

I ” m

- 72-

Page 21: hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수 -색인자료건수 -색인 갱신 주기 -검색 기법 어느 한검색멘진의

λ소

4 ,흐주}

ur.t:IJtA I

• 전문검색맨진 - Yello Page (www.yellow.com)

- BigBook (www.bigbook.com)

- SalesLeadsUSA (www.abii.com)

- NewsPage (www.newspage.com)

- NewsTracker (nt. excite.com)

- Price Watch (www.pricewatch.com)

- Computer ESP (www.uvision.com)

- Internet Movie Oatabase (www.imdb.com)

- MapQuest (www.mapquest. com)

- Xerox Parc Map Viewer (pubweb.parc.xerox.com/map)

- Image Surfer (ipix.yahoo.com)

- WebSeer (webseer. cs.uchicago.edu)

” m M 이

I

주 · 고

-κ·

• 정보검색 대행업체 - 야후의 목록

(www.yahoo.com/Business_and_Economy/Companiesllnformationllnformati。

n_Brokers/)

- answers.com (www.answers.com)

- 장미디어 인터랙티브 (www.jmi. co.kr)

- 인터넷과 킴퓨터 (www.innco.co.kr)

• 쇼핑 에이전트 - Bargainbot Search Agent (www.ece.curtin .edu.au/-saounb/bargainbotl)

- BargainFinder Agent (bf.csta r. ac.com/bf/)

- Jango (www껴ngo . com)

- MX BookFinder (www.mx.orglbookfinder/)

” m

g R

% I