products의 name 필드값을 토큰(token)으로 분리해 역인덱스(Inverted Index)로 저장하는 과정을 살펴봤다. 이 과정에서 문자열(text)을 토큰으로 변환시켜주는 장치를 보고 애널라이저(Analyzer)라고 부른다. POST /products/_create/1 { "name": "Apple 2025 맥북 에어 13 M4 10코어" } POST /products/_create/2 { "name": "Apple 2024 에어팟 4세대" } POST /products/_create/3 { "name": "Apple 2024 아이패드 mini A17 Pro" }
토큰(token) | 도큐먼트 id |
Apple | [1, 2, 3] |
2025 | [1] |
맥북 | [1] |
에어 | [1] |
13 | [1] |
M4 | [1] |
10코어 | [1] |
2024 | [2, 3] |
에어팟 | [2] |
4세대 | [2] |
아이패드 | [3] |
mini | [3] |
A17 | [3] |
Pro | [3] |

<h1>아이폰 15 사용 후기</h1> → 아이폰 15 사용 후기,, ., !, ?와 같은 문장 부호를 기준으로 자름)The Brown-Foxes jumped over the roof.The, Brown, Foxes, jumped, over, the, roof]The, Brown, Foxes, jumped, over, the, roof]the, brown, foxes, jumped, over, the, roof]a, the, is와 같은 특별한 의미를 가지지 않는 단어 제거)the, brown, foxes, jumped, over, the, roof]brown, foxes, jumped, roof]brown, foxes, jumped, roof]brown, fox, jump, roof]