분류 전체보기
-
[산업기능요원] 0. 정보처리 편입 계기 및 후기Career 2022. 8. 15. 15:33
2020년 겨울, 보충역으로 정보처리 분야 편입에 성공하였습니다. 글을 작성하는 지금은 훈련소도 마치고 복무 기간이 거의 끝나가는데요, 편입 및 전직하는 과정과 복무하며 든 생각들을 앞으로 정리해보고자 합니다. 편입 계기 뜻하지 않게 신체검사 4급을 받고, 석사 후 전문연구요원을 가겠다는 막연한 꿈만 가지고 살아가다 졸업을 한 학기 앞두니 불안해지기 시작했습니다. 아마 주변에 점점 전역하는 친구가 많아져서, 또 자꾸 인원을 줄이겠다고 해서 걱정이 되어 그랬던 것 같습니다.(지금은 괜한 걱정이었다고 생각하지만, 그래도 후회하지는 않습니다.) 당시 속해있던 연구실의 교수님께서도 전문연구요원하겠다고 석사를 하는 것은 잘못된 것 같다고, 군대를 해결하고 진정 학문에 뜻이 있다면 그때 석사를 하는 게 나을 것 같..
-
[Python] pptx to pdf 불가능(mac)Quick Note 2022. 8. 8. 16:20
상황: mac/ubuntu의 python에서 `python-pptx` 패키지를 이용하여 pptx 문서를 만들고, 이를 pdf로 저장하려고 함. Window에서는 특정 패키지 이용하여 가능하다고 나오지만, mac/ubuntu는 유료 api 말고는 없다는 듯이 나옴 해결: 온전히 해결하는 방법을 찾지 못하여 가능한 다른 방법 고안: 웹 스크래핑을 통해서 ppt를 pdf로 바꿔주는 사이트에 파일 올리고, 다운로드 결과물 자체를 ppt가 아닌 html 형식으로 결과물을 만들어 `pdfkit` 패키지 이용하여 추출 첫 번째 방법은 배보다 배꼽이 더 커질 것 같아 후자의 방법으로 결과물 자체를 pptx가 아닌 html로 만들어서 진행함. 혹시 맥에서 pptx를 pdf로 저장할 수 있는 다른 방법이 있다면 조언 부탁..
-
[Python] pdf 추출할 때 색 반영안되는 문제 해결Quick Note 2022. 8. 7. 15:09
상황: 파이썬에서 html 형식의 파일을 `pdfkit` 패키지를 이용하여 pdf로 추출할 때, html 파일에서는 색이 나오지만 pdf에서는 색이 나오지 않음 import pdfkit html = """ Hello """ with open('ex_html.html', 'w+', encoding='UTF-8-sig') as html_file: html_file.write(html) pdfkit.from_file('ex_html.html', 'ex_pdf.pdf') 원인: 색 지정을 `rgba()`를 통해 넣어주었는데, pdf로 변환할 때 `rgba()`를 인식하지 못하는 것으로 보임 해결: 색 지정을 `rgb()` 혹은 헥스값('#000000') 으로 넣어주면 정상적으로 나옴
-
0. MySQL 8.0 Docker Compose 환경 구축SQL/MySQL 2021. 11. 26. 10:44
0. Introduction 최근 최신 버전의 MySQL을 다운받아 사용해야 할 일이 있었습니다. 편의를 위해 docker를 통해 환경을 구축하였고, 이후에 참고하기 위해 블로그에 정리한 내용입니다. 저도 docker에 대해선 아직 많이 부족하여 자세한 설명은 어려울 것 같고, 대부분의 내용은 이 포스트를 보고 작성하였습니다. Docker가 설치되어있다는 가정하에 진행하도록 하겠습니다. 1. MySQL 8 이미지 다운받기 docker pull mysql:8 2. Container와 연결할 폴더 만들기 원하는 곳에 새로운 폴더를 만듭니다. 3. Docker Compose 작성하기 "container_name": 원하는 컨테이너명 "image": 도커 이미지(앞서 다운받은 mysql:8) "volumes":..
-
Ridge / LASSO RegressionData Science/Modeling 2021. 10. 4. 16:36
Ridge와 LASSO Regression에 대한 자세한 설명은 다른 블로그에 잘 나와있으니 간단하게만 다룰 예정입니다. 대신, Ridge는 왜 가중치가 0이 되지 않고 LASSO는 0이 되는지 수식적으로 이해가 가지 않았는데, 이와 관련하여 개인적으로 이해가 수월했던 글이 있어 정리하고자 합니다. Ridge Regression Ridge Regression은 가중치의 제곱합을 최소화하는 것을 추가적인 제약 조건(L2-norm)으로 하는 선형 회귀 모델입니다. 패널티항인 $\lambda \sum_{i=1}^{n} \beta_i^2$이 추가됩니다. 이는 모델을 데이터에 맞추는 것뿐만 아니라 모델의 가중치가 가능한 한 작게 유지되도록 노력합니다. 패널티항은 학습하는 동안에만 추가되고, 테스트 셋에 대한 성능..