[프로젝트] (2) 썸네일형 리스트형 [프로젝트] 머신러닝 악성코드 feature 요소 머신러닝 Random Forest를 활용하여 딥러닝, 엘라스틱 서치 결과 상호보완 XGBoost LightGBM 딥러닝 CNN 기반 딥러닝 Image 학습 모델링 Text CNN 기반 strings Feature 학습 모델링 엘라스틱서치 특징 정보 추출하여 유사도 점수 확보 M2Lab에서 했던거 적극 활용 정적 정보 PE Header 다수 파일에 대한 통계적 분석으로 피처 선별 Section Information 출현 빈도가 높은 대상 선정 section Name Resource 출현 빈도가 높은 대상 선정 Resouce Type Assmbly Instruction 출현 빈도가 높은 대상 선정 opcode Name Byte-1-Gram PE 바이너리 내 출현하는 0~255 범위의 바이트 값의 빈도 수 및.. [머신러닝] 앙상블 모델 구현 머신러닝 앙상블 모델 구현 1. 데이터 수집 각각의 요소에 대한 피처 값을 구한 뒤 csv 파일로 저장 이때, 마지막 열은 label 값이 지정된다. 2. 데이터 전처리 (Pre-processing) import numpy as np from sklearn.linear_model import LogisticRegression from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import GradientBoostingClassifier from sklearn.ensemble import AdaBoostClassifier from sklear.. 이전 1 다음