글을 벡터로 변환하는 방법
특정 뉴스 기사에 다음과 같은 단어가 있다고 가정해보자 몇 | 번 | 을 | 쓰러지다 | 몇 | 번 |을 | 무너지다|다시 |일어나다 그럼 이것을 Word to Dictionary로 변환하면 다음과 같다. Word_Dictionary { "몇":1, "번":2, "을":3, "쓰러지다":4, "무너지다":5, "다시":6, "일어나다":7 } Vector_Data = [2,2,2,1,1,1,1] #단어 카운팅 위와 같이 딕셔너리 형태로 만들 수 있고 이를 각 뉴스, 신문, 글과 같은 카테고리로 분류하여 해당 단어에 대해 얼마나 '카운팅'되었는지를 기반으로 벡터를 형성할 수 있다. 그리고 이는 딥러닝에서 다음과 같이 활용된다. 세부적인 코드는 생략 X_train, X_test, Y_train, Y_test..