-
색인의 구분
-
색인어의 유형에 따라
-
주제색인
- 정보주제의 주제를 나타내는 요소를 색인어로 선택한 색인
-
비주제색인
- 저자명,표제,기관명, 등 주제와 직접적인 관계가 없는 요소를 색인어로 선택한 색인
-
용어 통제 여부에 따라
-
자연어색인
- 주제분야가 한정되어 있는 시스템에서 최종이용자가 전문용어에 익숙한 경우 효과적
- 탐색어로 자연어 사용-> 탐색시 절단 탐색을 통해 검색효율 높임
-
자연언어의 장점
- 개념을 그대로 표현
- 다양한 접근점 제공
- 신축성이 높다
- 정확률을 높일수 있다
- 특정성이 높다
- 색인불필요
- 데이터교환이 유리
- 새로운 개념표현이 쉽다
- 주제전문가에게 유리
- 입력비용이 저렴
-
자연언어의 단점
- 동음어, 동음이의어가 있는 경우 정확율 떨어짐
- 부적합 문헌 검색
- 상위개념에 대한 탐색이 어렵다
- 색인파일 유지비용이 높다
- 표준화가 불가능
- 재현율이 낮다
- 개념간의 관계정립 불가능
- 해당 분야의 어휘를 많이 알아야 함
-
통제언어색인
- 정보전문가에게 유리
- 자연언어에 비해 용어의 특정성 떨어짐
-
통제언어의 장점
- 동의어,동음이의어 통제
- 부적합 문헌을 통제하기 위한 전조합이 가능
- 상위개념 탐색이 쉽다
- 표준화가 가능
- 계층관계 허용
- 검색전문가에게 유리
-
통제언어의 단점
- 새로운 개념 표현이 어렵다
- 복잡한 개념 표현이 어렵다
- 일관성으로 인해 포괄성이 낮다
- 접근성이 낮다
- 통제어휘집의 유지비용이 필요하다
- 신축성이 낮다
-
전조합색인과 후조합색인
- 전조합색인
- 후조합색인
-
수작업색인과 자동 색인
-
수작업색인
- 색인작업자가 임의로 색인어를 부여하거나 통제어휘집을 참고하여 색인어를 선택
- 색인작업시 일관성 결어
-
자동색인
- 컴퓨터에 의해 작성
- 단어출현빈도의 통계적 분석에 기초
-
문제점
- 현빈도에 근거한 통계기법은 문헌의 주제분석에 부적합
- 불용어리스트가 주제분야에 따라 달라 부적절한 색인어 선택
- 자연어색인이므로 용어의 통제 불가능
- 동의어사전이나 용어절단기법으로 검색효율 높임
- 표제 및 초록 도는 본문의 기계가독데이타베이스 구축
- 경제적인 색인작업 가능
- 신속한 정보검색 가능
-
인용문헌을 이용한 색인기법
-
종류
- 직접색인
-
간접색인
- 문헌 속에 내포된 인용문헌을 이용하는 색인