최근 수정 시각 : 2022-08-11 16:35:24

검색 엔진

1. 개요2. 목표3. 기능4. 목록
4.1. 국내 서비스 중4.2. 해외 서비스 중4.3. 서비스 종료

1. 개요

search engine. 월드 와이드 웹 상에 존재하는 정보웹 사이트검색하기 위한 프로그램이다. 웹의 정보를 긁어오는 소프트웨어는 크롤러라고 부르고, 그 행위는 크롤링이라고 부른다. 참고로 일반 검색 엔진에 안 잡히는 웹을 딥 웹이라 한다.

검색 엔진은 프로그램을 가리키는 것이고 그 프로그램으로 검색 서비스를 제공하는 곳은 '검색 사이트'지만, 사실상 검색 엔진이라는 용어로 두 의미를 혼용하고 있다. 또한, 사실상 포털 사이트와 동의어로 쓰이기도 한다. 이는 대부분의 포털 사이트가 검색 서비스를 제공하고 있기 때문이다.

2010년대 들어선 모바일의 강세와 유튜브의 강세로 검색 엔진의 입지가 좁아지는 중이다. 현대 들어서 제대로 된 검색은 구글을 통해 시행할 뿐 대부분의 정보는 검색이 아닌 유튜브나 SNS로 얻는게 대세가 되었기 때문. 네이버는 검색엔진의 힘이 2000년대 비해 보잘것 없다는 얘기를 듣지만 쇼핑[1], 메신저, 웹툰 등을 강화해 좋은 평가를 받고 있는 반면 검색 엔진에 역량을 집중한 바이두는 쇼핑의 알리바바, SNS와 메신저의 텐센트에 비교해 모바일 환경에 전혀 강점이 없다는 평가를 듣고 있다.

2. 목표

  • 검색의 품질, 효과성: 사용자가 원하는 정보에 부합하는 정보를 모으는 능력이다.
  • 검색의 속도, 효율: 이름 그대로 검색 속도이다.

3. 기능

  • 색인 과정: 빠른 검색을 위해 색인(Index)이라 하는 키워드를 만들고 정리한다.
    • 텍스트 획득
      • 크롤링
      • 피드 (Feed): 문서를 실시간으로 나열하는 기능.
      • 인코딩
    • 텍스트 변환: 텍스트를 색인어로 변환한다.
      • 파서
      • 불용어 제거
      • 스테밍
      • 링크 추출 및 분석
      • 정보 추출
      • 분류
    • 색인 생성 / 검색 등록: 빠른 검색을 위해 데이터베이스를 만든다.
      • 통계
      • 가중치 부여
      • 인버전
      • 색인 분산
  • 질의 과정
    • 사용자 경험 및 사용자 인터페이스
      • 질의 입력
      • 질의 변환
      • 결과 출력
    • 순위부여: 사용자에 맞게 검색의 우선순위를 만든다.
    • 평가: 품질과 속도를 평가.
      • 로깅
      • 순위부여 분석
      • 성능분석

4. 목록

다른 업체(들)로부터 검색결과를 사온 후 편집하여 보여주는 사이트는 검색 결과를 사오는 회사의 이름을 같이 기재하여 목록에 포함시킨다.

검색 말고도 뉴스, 게임 등 다른 서비스를 제공하는 종합 포털 사이트의 경우 독자적인 자체 검색엔진을 보유한 경력이 있는 경우에만 이 목록에 추가한다. 단, 타 사이트에서 검색결과를 제공받으면 ▩표를 한다.

4.1. 국내 서비스 중

  • 구글: 전세계에서 가장 많이 사용되는 검색 엔진.
  • Bing: Microsoft Edge의 기본 검색 엔진.
  • zum: 영문 검색, 이미지 검색 등 일부 검색은 구글 맞춤 검색을 사용하고 있다.#1#2
  • 네이버: 국내에서 가장 많이 사용하는 검색 엔진.
  • 네이트▩: 다음으로부터 검색 결과를 제공받는다.[2]
  • 다음: 자체적 검색 외에도 Bing의 검색 결과도 보여준다.
  • 드림위즈
  • 나무위키: 자체적 검색 엔진이 있으며, 크롬과 웨일 브라우저에서 기본 엔진으로 설정이 가능하다.
  • 코리아닷컴

4.2. 해외 서비스 중

  • AOL▩ : Bing에서 검색결과를 제공받는다.
  • Ask Jeeves▩ : 구글에서 검색결과를 제공받는다.
  • Brave Search▩ : 자체 검색결과를 제공하나, 결과가 존재하지 않을 때 Google Fallback 옵션을 이용하여 구글 검색결과를 받아볼 수 있다.
  • Boodigo
  • Bing
  • Disconnect▩ : 구글, Bing, 야후에서 검색결과를 제공받았지만 현재 구글은 차단된 상태. Tor 브라우저 기본 검색 엔진.
  • Dogpile▩ : 구글, 야후에서 검색결과를 제공받는다.
  • DuckDuckGo: 개인정보를 전혀 수집하지 않는 개인정보 중시 검색엔진. 개인정보 보호에 관심이 많아지는 추세에 전세계 점유율 2위를 찍었다가 다시 4~5위로 내려갔다.
  • Ecosia : 검색엔진을 이용한 만큼 나무를 심는 사회적 기업.
  • Gigablast
  • 구글
  • ixquick▩: 구글, 야후, Bing에서 검색결과를 제공받는다. 과거 Tor 브라우저 기본 검색 엔진. 현재 StartPage에 인수됨.
  • StartPage.com▩: 구글에서 검색결과를 제공받는다. DuckDuckGo와 같은 프라이버시 중시 검색 엔진.
  • Wolfram Alpha
  • 룩스마트: 2015년에는 검색광고 업체로 바뀌었다.
  • 라이코스▩: Bing으로부터 검색결과를 제공받는다.
  • 바이두
  • 얀덱스
  • 익사이트▩: Dogpile에서 검색결과를 제공받는다.
  • 야후!▩: Bing에서 검색결과를 제공받는다.
  • 야후! 재팬▩: 구글에서 검색결과를 제공받는다.
  • 핫봇▩: 라이코스에서 검색결과를 제공받는다.
  • 엘라스틱 서치: 오픈소스 검색엔진.
  • 웹크롤러: 현재까지 살아남은 검색 엔진 중 최장수 엔진. 자체 엔진으로 서비스 중이지만 퀄리티가 썩 좋지는 않아 쓰는 사람이 거의 없기에 사실상 사장되었다.[3]

4.3. 서비스 종료

  • 국내
    • 까치네
    • 미스다찾니: 메타 검색엔진으로 한미르, 알타비스타, 라이코스, 야후!, ....등 다양한 검색엔진에서 결과를 가져왔다.
    • 마이엠
    • 심마니: 천리안에 인수됐고, 천리안도 검색 분야는 사실상 손을 놓은 상황이니...
    • 엠파스: 상기된 네이트와 통합.
    • 야후!: 2014년에 국내 서비스는 종료됐지만, 해외 서비스는 있다.
    • 첫눈
    • 큐로보
    • 코시크: 1995년 서비스를 시작한 최초의 한글 검색엔진.
    • 파란(정보탐정) : 한미르와 하이텔이 통합한 사이트였지만, 결국은 사라졌다.
  • 해외
    • Blekko
    • Cuil
    • Infoseek
    • Teoma
    • 와카노: 맨 처음에는 세계로 진출하는 한국 검색엔진이었지만 얼마 안 가 망하고 일본 지사만 남아 지금은 일본 검색 엔진이다. 검색하려 하면 서버랑 연결이 안 되는 건 넘어가기로 하자.
    • 잉크토미
    • 알타비스타




[1] 네이버쇼핑은 네이버페이와 결합해 2020년 현재 국내 2위 인터넷쇼핑 업체로 자리잡았다.[2] 엠파스 인수 시까지만 해도 자체적인 검색 엔진을 보유했었다.[3] 단, 자체 홈페이지로 검색 엔진 서비스를 제공한 최초의 기업은 구글이다. 웹크롤러는 처음 시작할 때는 워싱턴 대학교 네트워크 홈페이지 상에서 기능했고, 이후 AOL에 인수되어 AOL 하위 홈페이지로 기능하다가, 2001년이 되어서야 자체 홈페이지로 서비스를 제공하였다.

분류