신영소식
HOME/신영소식/소식&공지
소식&공지
신영ESD의 다양한 소식과 공지사항을 전해드립니다.

소식 [한국데이터산업진흥원 교육 후기] Python 활용 교육

2024.02.01

[한국데이터산업진흥원 교육 후기] Python 활용 교육


안녕하세요. 저번 데이터 분석 교육을 듣고 드디어 이번차시에 Python 활용 교육을 듣게 되었습니다.
우선 Python 활용 교육 또한 한국데이터산업진흥원에서 지원하는 교육이며, 온라인 교육과 오프라인 교육 중에 이번에도 온라인으로 듣게 되었습니다.

> 데이터분석 교육 보러가기

온라인 교육 데이터 분석 파트에는 앞전에 들은 데이터 분석 방법론과 그 외에 R기초 사용법, 상관분석, 회귀분석, Python 활용, 인공신경망과 딥러닝, IoT, Apache Spark, Apache Zeppelin, 데이터 시각화 등의 교육이 있습니다.



Python 활용 교육 주제
강의 내용
제1강 Python 개요
제2강 Python Data Structure
제3강 Python Statements
제4강 Python Iterable
제5강 Python Class
제6강 Built in Function
제7강 데이터 분석 개요
제8강 데이터 분석 환경 구축
제9강 데이터 다루기
제10강 데이터 분석 주요 라이브러리
제11강 데이터 분석 실습
제12강 웹스크래핑 개요
제13강 웹문서 파싱
제14강 웹크롤링



전반적인 교육 내용

○ Python 구현


○ Python 표준 라이브러리


○ Python 공백 사용 규칙
   - 4개의 공백을 사용
   - 공백과 탭 혼용 금지
   - 동일한 들여쓰기 단계에서 연속되는 코드행은 동일한 블록으로 간주
   - 예외에 대해서는 다른 방법으로 코드 가독성 개선

○ Python Modularity
   - 가장 세분화된 모듈화 기능은 재사용 가능한 함수의 정의
   - 모듈은 다른 모듈에서 사용 가능
   - 모듈을 가져오거나 실행할 때 정확하게 이해하는 것이 중요

○ Python Scalar 유형


○ Python 관계 연산자


○ Python Collection 유형


○ Python Collection 규약


○ Python String
   - 문자열의 문자는 변경이 불가능
   - 파이썬 문자열은 따옴표로 구분
   - 따옴표 사용시 일관성을 유지
   - 인접한 문자열은 파이썬 컴파일러에 의해 하나의 문자열로 연결

○ Python String 원시 문자열
   - Windows 파일 시스템 경로나 정규 표현식 패턴과 같은 문자열을 처리 시,
     역 슬래시를 2배로 늘리는 방법은 보기 불편할뿐더러 오류가 발생하루 수 있음
   - 소문자 r을 사용하여 원시 문자열로 만들 수 있음
   - ex) path = r'C:\users\kdata\Documents'
                   print(path)


○ Python Comprehensions
   - List, Set, Dict을 선언적 또는 기능적 스타일로 설명하는 간결한 구문


○ Python Generator
   - iterable sequence를 정의
   - 메모리를 효율적으로 사용
   - yield 키워드를 한번이상 사용하는 모든 python 함수로 정의

○ Python Class 정의
   - 객체를 생성할 때 객체의 구조와 동작을 정의하는 수단
   - class명에 Came|Case를 사용
   - Method는 class내에 정의된 함수
   - Instance Method는 Instance에서 호출할 수 있는 함수
   - self는 모든 Instance Method의 첫 번째 인수
   - _init_ 초기화 Method

○ 데이터 분석 개요 (OSEMN)
   - 데이터 획득 (Obtaining data)
   - 데이터 제거 (Scrubbing data)
   - 데이터 탐색 (Exploring data)
   - 데이터 모델링 (Modeling data)
   - 데이터 해석 (INterpreting data)

○ Jupyter Notebook
   - IPyhon notebook
   - 코드, 설명문, 이미지, 비디오 등을 하나의 문서내에 결합 가능
   - 웹 브라우저 실행 가능
   - 다른 언어 코드 지원 가능
   - 다양한 형식으로 내보내기 가능

○ Python Collection 유형


○ Numpy
   - 효율적인 대용량 배열 처리 가능
   - 고차원의 배열 및 행렬 활용
   - 동일한 종류의 데이터 유형 처리 적합
   - 높은 수준의 수학함수 제공

○ Pandas
   - Numpy위에 빌드되어 구축됨
   - 테이블 형식의 데이터 작업을 위한 구조와 연산을 제공
   - DataFrame 구조를 통한 쉽고 효율적인 데이터 처리 제공
   - 다양한 시각화 생성을 위한 고급함수 제공

○ 웹 스크레핑 개요
   - 스크레핑(Scraping)이란 웹사이트 특정 정보를 추출하는 기술


○ Numpy 함수 및 자료형


○ 웹 크롤링 개요
   - 크롤링(Crawling)이란 프로그램이 웹 사이를 정기적으로 돌며 정보를 추출하는 기술

○ CSS Selector



이번 강의에는 위에서 보이듯이 이론적인 내용이 많아 보이지만 이와 비교도 되지 않을 정도로 실습하는 내용이 정말 엄청 많았습니다. 강의 중반부부터 본격적으로 실습하는 부분들이 많아서 수강하는 중 다소 어렵게 느껴지고 막히는 부분들이 있었지만,
웬만한 쿼리문이나 개발언어들은 구글링으로 해결할 수 있었고, 전에도 교육 들으면서 느꼈지만 눈으로 강의를 따라가는 것에 그치지 않고 실제로 직접 하나하나 실습해봐야 확실히 본인의 영역으로 흡수 되는 것 같습니다.

본 교육을 통해서 사업 수행적인 방면으로도 활용할 수 있을지 아직은 미지수로 생각되어지지만 이렇게 많은 교육기관들의 교육 강의와 별도의 시간을 들여 꾸준하게 연습하고 학습해나간다면 사업 수행적인 방면으로도 도움이 되고 나아가 학습자의 역량 강화에도 큰 도움이 될 것입니다.



[글/사진] 김지곤 과장 / gony880@gmail.com