반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- nodejs
- OS
- 데이터 시각화
- 코틀린
- MSE
- 선형회귀
- windows server
- Current
- DataFrame
- react
- node.js
- tls
- git
- 데이터 랭글링 예제
- 보안
- 도서리뷰
- 암호
- pandas
- ai
- AI기초
- window server
- React개념
- it책
- 경사강하법
- 데이터 랭글링
- git에러
- Numpy
- LDAP
- Active Directory
- 소프트웨어 장인
Archives
- Today
- Total
목록DataFrame (1)
blueforestDEV
[AI 기초 다지기] 데이터 랭글링
데이터 랭글링은 데이터 과학과 분석에서 필수적인 과정으로, 원시 데이터를 분석에 적합한 형식으로 준비하는 작업을 의미한다. 이 과정은 데이터를 청소하고 구조화하는 것을 포함하며, 분석에 필요한 데이터를 더 쉽게 다룰 수 있도록 도와준다. 데이터 랭글링을 거치지 않은 데이터는 종종 불완전하거나 부정확할 수 있어서, 올바른 분석 결과를 도출해내기 어렵다. 데이터 랭글링의 주요 단계는 다음과 같다. 1. 데이터 정제: 원시 데이터는 누락된 값, 중복된 값, 비정상적인 데이터(이상치) 등 불완전한 부분이 있을 수 있다. 이를 해결하기 위해 다음과 같은 작업을 수행한다누락된 데이터 처리: 결측값을 평균 값으로 채우거나, 특정 규칙에 따라 제거 또는 대체할 수 있다.중복 데이터 제거: 중복된 데이터 행을 찾아..
AI
2024. 10. 14. 16:06