본문 바로가기
728x90

IT 개인학습45

sys.stdin.readline(), Python3와 PyPy3 입력의 개수가 많은 경우에는 단순히 input() 함수를 그대로 사용하지는 않는다. 파이썬의 기본 input() 함수는 동작 속도가 느려서 시간 초과로 오답 판정을 받을 수 있기 때문이다. import sys data = sys.stdin.readline() # hello world print(data) hello world # 줄 바꿈 공백 생김 data = sys.stdin.readline().rstrip() print(data) hello world # ex input = sys.stdin.readline n, m = map(int, input().split()) ### map = 각 원소의 어떤 함수를 적용할지 설정할 수 있음 = map 사용후 바로 활용하는 경우에는 list()를 같이 적용해줘야.. 2022. 8. 5.
README template https://gist.github.com/PurpleBooth/109311bb0361f32d87a2#file-readme-template-md A template to make good README.md A template to make good README.md. GitHub Gist: instantly share code, notes, and snippets. gist.github.com https://geniewishescometrue.tistory.com/entry/%EB%A7%88%ED%81%AC%EB%8B%A4%EC%9A%B4-%EA%B4%80%EB%A0%A8-%ED%8C%81-%EA%B8%80-%EC%83%89%EC%83%81-%ED%98%95%EA%B4%91%ED%8E%9C [Markdo.. 2022. 6. 8.
Big O 표기법 실제 알고리즘 러닝타임을 측정하기 위함도 있지만 장기적으로 데이터가 증가함에 따라 처리 시간의 증가율을 예측하기 위해 사용 시간 복잡도, 공간 복잡도 분석은 문제 풀이의 핵심 (= 최악의 경우에 대한 연산 횟수가 중요, 즉 최악의 경우의 시간 복잡도를 우선적으로 고려) (= 시간 제한 1초, 메모리 제한 128MB) * 문제를 해석하기 전에 조건을 먼저 확인 - 문제의 조건부터 확인하면 문제를 풀기 위해 얼마나 효율적인 알고리즘을 작성해야 하는지 알 수 있음 EX) 데이터 개수가 N이 1,000만 개를 넘어가며 시간 제한이 1초라면, 대략 최악의 경우 O(N)의 시간 복잡도로 동작하는 알고리즘을 작성 or 데이터 크기나 탐색 범위가 100억이나 1,000억을 넘어가는 경우 "이진 탐색"과 같이 O(log.. 2022. 6. 4.
Pillow image mode Pillow image mode 이미지의 mode이미지는 픽셀의 유형과 깊이를 정의하는 문자열입니다. 각 픽셀은 비트 심도의 전체 범위를 사용합니다. * 1비트 픽셀의 범위는 0-1이고 * 8비트 픽셀의 범위는 0-255입니다. 일반적으로 이미지는 RGB입니다. 즉, 3개의 채널이 있습니다. 이것은 일반적으로 각 픽셀이 3바이트의 저장 공간을 차지함을 의미합니다. 하나는 빨간색, 하나는 녹색, 하나는 파란색입니다. 모드 이미지가 있는 경우 P이는 팔레트화되었음을 의미합니다. 즉, 최대 256개의 다른 색상을 포함하는 팔레트가 있으며 각 픽셀에 대해 R, G 및 B에 대해 3바이트를 저장하는 대신 팔레트에 대한 인덱스인 1바이트를 저장합니다. 이것은 장점과 단점을 모두 제공합니다. 이점은 이미지에 메모리 .. 2022. 5. 7.
Python 내장함수 및 라이브러리 #for 반복문으로 2차원 리스트 만들기 a = [] # 빈 리스트 생성 for i in range(3): line = [] # 안쪽 리스트로 사용할 빈 리스트 생성 for j in range(2): line.append(0) # 안쪽 리스트에 0 추가 a.append(line) # 전체 리스트에 안쪽 리스트를 추가 print(a) [[0, 0], [0, 0], [0, 0]] # for문 줄이기 a = [[0 for j in range(2)] for i in range(3)] [[0, 0], [0, 0], [0, 0]] #리스트 원소 개수만큼 리스트 만들기 a = [3, 1, 4, 3, 5] # 가로 크기를 저장한 리스트 b = [] # 빈 리스트 생성 for i in a: # 가로 크기를 저장한 리스트.. 2022. 5. 7.
Pyspark Apache Spark는 Scala 프로그래밍 언어로 작성되었습니다 또한, PySpark를 사용하면 Apache Spark와 Python 프로그래밍 언어로 RDD(Resilient Distributed Datasets)에 접속하는 데 도움이 됩니다. 이를 위해 Py4j 라이브러리를 활용했습니다. Py4J는 PySpark에 내장된 대중적인 라이브러리이며 JVM 개체를 사용해 Python의 동적인 인터페이스를 허용합니다. PySpark에는 효율적인 프로그램을 쓰는 데 좋은 라이브러리가 꽤 많습니다. 또한 호환되는 외부 라이브러리도 다양합니다. 출처 : https://databricks.com/kr/glossary/pyspark PySpark란 무엇입니까? - Databricks PySpark는 Apache .. 2022. 5. 7.
Encoding 인코딩 인코딩(Encoding)이란? 파일에 저장된 정보의 형태나 형식을 데이터 표준화, 보안, 처리 속도 향상, 저장 공간 절약 등을 위해서 다른 형태로 변환하는 처리 혹은 그 처리 방식을 말한다. 에서 많이 사용되며, 반대말은 디코딩(decoding)이다. URL 인코딩이란? URL에서 URL로 사용할 수 없는 문자 혹은 URL로 사용할 수 있지만 의미가 왜곡될 수 있는 문자들을 '%XX'의 형태로 변환하는 것을 말한다. 즉, 컴퓨터가 이해할 수 있는 형식으로 바꿔주는것 왜 URL 인코딩을 사용할까? 인터넷을 통해 전송할 수 있는 문자는 오로지 ASCII 문자이기 때문이다. 따라서 ASCII 문자가 아닌 문자는 인터넷을 통해 전송할 수 있는 형태로 변환해줘야 한다. ASCII 문자라 하더라도 예약된 의미를 .. 2022. 5. 7.
Tempfile 사용 이유 프로그램 실행 중 일시적으로 데이터를 저장해야 하거나 많은 양의 데이터로 작업할 때 임시 파일이 필요할 수 있다. 이러한 종류의 파일은 데이터를 영구적으로 저장하고 싶지 않을 때 매우 유용 = 프로그램이 실행되는 동안 파일이나 디렉토리에 데이터를 임시로 쓰고 읽고 저장할 수 있다. 기본적으로 파일은 w+b 모드로 열린다. 즉, 열린 파일을 읽고 쓸 수 있다. 파일이 모든 유형의 데이터와 함께 작동할 수 있도록 바이너리 모드가 사용된다. import tempfile # TemporaryFile with tempfile.NamedTemporaryFile() as temp: print(temp.name) temp.write(...) # TemporaryDirectory with tempfile.Te.. 2022. 5. 7.