본문 바로가기
728x90

데이터 엔지니어링(DE)/파이썬 활용3

DataBase / ORM SQLalchemy / session 학습 목표 ORM 에 대해서 설명할 수 있어야 합니다. ORM 의 장단점 및 특징들을 이해할 수 있어야 합니다. ORM 을 통해 데이터베이스에 저장할 수 있어야 합니다. sqlalchemy 라이브러리를 사용할 수 있어야 합니다. 파이썬 DBAPI 에 대해서 설명할 수 있어야 합니다. 파이썬으로 데이터베이스와 연결할 수 있어야 합니다. 파이썬에서 데이터베이스와 상호작용 할 수 있어야 합니다. PEP 249 파이썬에서는 데이터베이스와 연결하는 파이썬 모듈들은 권장되는 가이드라인을 따라 제작되도록 안내합니다. 실제로 문서를 보시면 어떤 함수들, 메소드, 파라미터, 키워드 등을 어떻게 해야 하는지도 나와있습니다. 이러한 명시적인 가이드라인 덕분에 파이썬에서 데이터베이스와 연결하는 작업은 다양한 데이터베이스라도 .. 2021. 7. 24.
DOM( Document Object Model ) DOM 은 웹 페이지에서 매우 중요한 역할을 하고 문서 객체 모델 - 프로그래밍 언어를 통해서 HTML 문서 등에 접근할 수 있도록 해준다. DOM 의 역할 덕분에 프로그래밍 언어에서도 웹 페이지의 요소나 스타일 등을 추가하거나 수정하는 등 다양한 작업을 진행할 수가 있다. 문서를 하나의 구조화된 형식으로 표현을 하기 때문에 이러한 구조를 통해서 원하는 동작을 할 수가 있다. - 특히 DOM 은 객체 (object) 로 표현을 하는데 이 때 object 란 자바스크립트에서 사용되는 데이터 구조 중 하나 파이썬에서는 자바스크립트의 object 와 비슷한 dictionary 가 존재 즉, DOM 을 통해서 프로그래밍 언어에서 사용할 수 있는 데이터 구조 형태로 작업을 수행할 수 있어 크롤링 등 웹 페이지와 .. 2021. 7. 21.
HTML / CSS / J.S Web Scraping, Web crawling * 학습목표 * 크롤링을 이해하고 설명할 수 있다. 파이썬을 통해서 크롤링을 할 수 있다. HTML 혹은 CSS 를 읽을 수 있다. DOM 에 대해서 설명할 수 있다. requests 라이브러리를 사용할 수 있다. beautifulsoup 라이브러리를 사용할 수 있다. ## code ## 경로를 병합하여 새 경로 생성 os.path.join('C:\Tmp', 'a', 'b') # "C:\Tmp\a\b" 현재 작업 폴더 얻기 os.getcwd() # "C:\Temp" 크롤링 (crawling) 혹은 스크레이핑 (scraping) 은 웹 페이지에 있는 데이터를 모으는 작업 scraping - 특정 정보를 가져오는 것이 목적 crawling - 인터넷에 있는 사이트들을 인덱싱하는 목적 == > 자동화에 초점이.. 2021. 7. 21.
728x90