M2를 사용한 이후로 쭉 pytorch를 사용하다가 오랜만에 tensorflow를 쓰려고 하니 온갖 에러를 맞이했다.... 마이그레이션 해서 사용하고 있었기 때문에 어느부분이 잘못되었는지를 잘 못찾고 있었는데 tensorflow 에러들을 확인하다가 놓친 부분이 있었기에 아예 삭제하고 잘 깔아보기로 했다. 기존 가상환경 패키지 리스트 만들기 (선택사항) tensorflow를 설치하기 위해서는 conda부터 재설치 해야하기 때문에 내 소중한 가상환경을 그대로 옮길 수 있도록 패키지 리스트를 저장해두었다. 기존에 사용하던 가상환경이 없다면 pass! # 패키지 리스트 txt파일 저장할 위치로 이동 cd download # 가상환경 활성화 conda activate 가상환경이름 # 패키지 리스트 만들기 pip ..
mecab 설치 개요 한국어 자연어처리하는 방법이 꽤나 까다롭다. mecab도 한번에 다운받을 수 있으면 좋을텐데 그렇지 못해서 아쉽다. mecab-ko 설치 mecab-ko-dic 설치 mecab-ko-for-google-colab 설치 (이거 대신 mecab-python을 설치하기도 한다) mecab-ko 설치 다운로드 페이지 위 페이지에서 tar 파일을 다운로드 받으면 되는데 mecab-0.996-ko-0.9.2.tar.gz로 설치하다가 오류가 발생하면 그 하위버전인 mecab-0.996-ko-0.9.1.tar.gz를 다시 다운받아서 설치하면 된다. mecab관련 다운로드 할 파일들이 많아서 나는 mecab이라는 폴더를 새로 만들어 그 안에서 수행했다. finder에서 직접 압축해제 해줘도 되고 터..
DTW(Dynamic Time Warping)은 동적 시간 워핑이라고 불린다. 두개의 시계열 데이터가 서로 얼마나 유사한지 비교할 때 사용한다. DTW를 사용하는 이유? - 두개의 시계열 데이터 길이가 달라도 유사도 비교 가능 - 비슷한 패턴이지만 시간차가 있는 경우(shift 발생) 유사도 비교 가능 DTW 계산방법 이론 공식으로 보는 방법도 있는데 예시를 들어서 계산하는게 더 이해가 잘 된다. 이론적인 설명 이후에 예시를 들어서 직접 계산해보도록 하자. 시계열 데이터 2개가 있다. 두 시계열의 길이 n, m은 길이가 같을 수도 있고 다를 수도 있다. 이 두개의 시계열을 나열하여 n x m 행렬을 만든다. 유클리드거리를 이용하여 최적의 와핑 경로를 탐색한다. 와핑경로는 두개의 시계열 데이터 P와 Q 사..
이전글 데이터 사이언티스트 직장인 대학원 준비하기 (성균관대학교 일반대학원 데이터사이언스융합학과) 데이터 사이언티스트 직장인 대학원 준비하기 2 :: 학업계획서 작성 및 원서접수 (성균관대학교 일반대학원 데이터사이언스융합학과) 면접후기 결론부터 얘기하자면 불합격.... 면접은 서류 제출한 모든 사람이 다 본 것 같았다. 면접 일정은 메일로 알려주는데 헷갈리는 부분이 좀 있었다. 다른 메일에는 면접이 10시 시작이라고 되어있는데 webex 설치 안내에는 내 면접시간이 13시라고 나왔기 때문이다. 면접 시작시간은 10시인데 10-11시팀, 11-12시팀, 13-14팀 이런식으로 한시간단위로 잘라서 면접을 진행하는 것 같았다. 나는 13-14시 팀에 속해있어서 12시50분부터 켜놓고 기다리고 있었는데 13시에..
지난 포스팅에 이어 원서접수 후기를 작성한다. 데이터 사이언티스트 직장인 대학원 준비하기 (성균관대학교 일반대학원 데이터사이언스융합학과) 데이터 사이언티스트 직장인 대학원 준비하기 (성균관대학교 일반대학원 데이터사이언스융합학 나는 비전공자로 국비지원 교육을 통해 현재 주니어 데이터사이언티스로 일한지 9개월차다. 빅데이터에 몸을 담은지는 1년이 지났다고 할 수 있다. 주변에서 대학원 가는게 장기적으로 이득이 magicode.tistory.com 오랜만에 자기소개서(학업계획서)를 쓰려고하니 어떻게 써야할지 감이 오지도 않았고 차일피일 작성을 미루고 있었다... 더는 미룰 수 없다는 생각에 학업계획서를 작성하기로 했다! 학업계획서를 쓸 때 가장 필요한것은 학과 홈페이지다. 그곳에서 교수님 정보, 커리큘럼, 연..
1. yolov4.yaml 생성 yolov4.yaml 경로 : yolov5/models https://github.com/Lornatang/YOLOv4-PyTorch/tree/048cb8c23a4dacadffd3db53f25aa7f4660087cf GitHub - Lornatang/YOLOv4-PyTorch: Pytorch implements yolov4.Good performance, easy to use, fast speed. Pytorch implements yolov4.Good performance, easy to use, fast speed. - GitHub - Lornatang/YOLOv4-PyTorch: Pytorch implements yolov4.Good performance, easy ..
나는 비전공자로 국비지원 교육을 통해 현재 주니어 데이터사이언티스로 일한지 9개월차다. 빅데이터에 몸을 담은지는 1년이 지났다고 할 수 있다. 주변에서 대학원 가는게 장기적으로 이득이 될거라는 이야기를 듣고 직장인이 다니기 좋은 대학원을 찾아보았다. 원래는 갈 생각이 없었는데 찾다보니 내 상황 상 대학원을 진학해도 좋고 안해도 좋은 느낌이라 일단 지원해보기로 했다. 왜 대학원에 진학하는가? 비전공자로서 관련 지식 및 인맥이 너무 없다고 느끼기 때문 업무를 하면서 배워도 좋지만 더 빠르게 성장하기 위한 발판이 필요하다고 느낌 무엇을 공부하고 싶은가? 국비교육으로는 기초 기술을 익히는데 급급했다면 대학원에서 알고싶은 것들은 1. 좀 더 정리된 이론들 2. 다른 사람들은 어떻게 공부하나 3. 미래에 나는 어떠..
#object_detection #image_labeling #polygon #CVAT #json #bbox #bounding_box_visualization #bbox_label_visualization > how to make bounding box(bbox) and polygon with CVAT? > how to visualized bbox and polygon? 컴퓨터비전의 아주 기초단계에는 이미지 라벨징 구축이 있다. 대부분 라벨링을 하고 학습을 시키기 때문에 시각화를 하는건 옵션사항일 수도 있는데, 컴퓨터비전을 처음 배우는 나로써는 하나씩 모든 것을 다 경험해보고 싶은 마음이다. 목표 1. 이미지에 직접 라벨링, 폴리곤을 만들기 2. bbox 예측을 포함한 시각화 1. 이미지 준비 일단은 실..
아래 명령어가 안되는 분들 pip install pycocotools conda install pycocotools pip install git+https://github.com/waleedka/cocoapi/git conda install -c conda-forge pycocotools 나는 이거 하니까 바로 깔렸다. from pycocotools.coco import COCO 실행해보면 잘 import 해오는걸 볼 수 있다.
Data Management 필요성 Raw Data를 처리하면서 다양한 시도들로 인해 Data의 버전이 많이 발생한다. 다양한 시도들을 하다보면 어떤 버전의 데이터를 사용해서 어떤 결과가 나왔는지 매칭하거나 관리하기 힘들어진다. 이를 관리하기 위하여 대부분의 사람들이 Git을 이용한다. 하지만 Git은 파일 크기에 제한이 있기 때문에 대용량 데이터를 관리하기에는 적합하지 않다. 대용량 데이터를 이용한 소스코드와 데이터를 같이 관리하기 위해서 DVC, Pachyderm, Delta Lake, Dolt 등의 툴이 생겼다. DVC Data Version Control의 약자다. 대부분의 스토리지와 호환 가능 (amazon s3, google drive...) 대부분의 git 호스팅 서버와 연동 가능 (GitH..