전체 글

전체 글

    영감을 주는 논문

    영감을 주는 논문

    원하는 결과를 얻지 못하는게 일상인 실험에서 요런 논문을 읽으면 푹 빠져서 읽게 된다 ㅎ_ㅎ 역시 세상에는 나와 비슷한 고민을 하는 사람이 완전 많음. 답에 가까워지는 느낌…? 답을 찾자! 🙏🏻

    [TIL] cannot find -lopencv_core 에러 해결 - Opencv(C++) 설치하기

    [TIL] cannot find -lopencv_core 에러 해결 - Opencv(C++) 설치하기

    Lane detection 코드를 돌리던 와중 evaluation을 c++ build 후에야 할 수 있다는걸 알게된 오늘의 나.. 통계학과인 나에게 너무 가혹한 evaluation 방식이다 .. ㅎㅎ...... 따라서 어찌저찌 make 파일을 build 하려고 했는데, 다음과 같은 오류를 직면했다. /usr/bin/ld: cannot find -lopencv_core 이 오류의 뜻은 -l 뒤의 패키지가 없다는 뜻이라고 한다. 따라서 opencv가 없는 상황이었고 다음과 같이 설치해주었다. 참고로 설치는 꽤 오래걸린다. # Install minimal prerequisites (Ubuntu 18.04 as reference) sudo apt update && sudo apt install -y cmake ..

    [Generation] 자세한 Pix2pixHD 논문 리뷰 (High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)

    [Generation] 자세한 Pix2pixHD 논문 리뷰 (High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)

    오늘은 인턴에서 자주 접하고 있는 Pix2pixHD(CVPR 17')에 대해 포스팅해보려고 한다. 생성모델은 아직은 익숙치 않지만, 확실히 컴퓨터비전의 꽃이라고 할 만큼 재밌는 분야인 것 같다 ㅎㅎ 그럼 포스팅을 시작해보겠다! 네트워크를 중심으로 정리할 예정이다. 많은 내용을 꾹꾹 눌러담았다! # Motivation 이 글을 읽는 독자들이라면 Pix2pix라는 생성 모델을 한번 쯤 들어본 적이 있을 수도 있을 것 같다. 일단 Pix2pixHD는 high-resolution(고해상도의)한 이미지를 생성해낼 수 있도록 기존 Pix2pix를 변형한 모델이다. 따라서 pix2pix를 밟고 올라오는 모델이라고 생각하면 되겠다. 기존의 pix2pix는 고해상도의 이미지 생성이 어려웠고, global한 생성은 가능하..

    [Python] shutil과 os로 디렉토리, 폴더 조작하기

    [Python] shutil과 os로 디렉토리, 폴더 조작하기

    컴퓨터 비전을 하다보면 디렉토리, 폴더 단위에서 python으로 파일을 나누거나 작업해야할 때가 생긴다. 따라서 간단한 명령어를 정리해놓으려고 한다. :) # 파일 리스트 출력하기 import os os.listdir(path) # 특정 파일의 경로를 다른 곳으로 이동하기 단 이 경우에는 "이동"이므로, 원래 저장소의 파일은 이동되어 존재하지 않게 된다. import shutil shutil.move(현재 파일 경로, 이동할 경로) # 특정 파일의 경로를 다른 곳으로 복사하기 위 경우 말고 원본 저장소에도 파일을 남겨두고 싶을 때는 copy를 하면 된다. import shutil shutil.copy(현재 파일 경로, 이동할 경로)

    [영상 Geometry] FOV(Field Of View)에 대해

    [영상 Geometry] FOV(Field Of View)에 대해

    이번에는 FoV에 대해 포스팅하려고 한다. Camera projection과 관련된 내용이니 잘 알아두면 좋을 것 같아서 정리한다! :) FOV(Field Of View) 일단 FOV(Field Of View)는 카메라가 볼 수 있는 최대 각도라고 생각하면 된다. 핀홀카메라 모델을 가정할 때 아래와 같은 그림이 그려질 수 있다. 카메라와 Image plane을 3차원으로 나타낸 그림이라고 이해하면 된다. 위 그림을 BEV(Bird Eye View) 즉, 위에서 본다고 생각해보자. 그럼 아래와 같은 그림이 그려지게 된다. 위 그림을 해석해보면, 일단 O는 카메라 중심이다. 그리고 맨 아래는 Image plane을 나타낸 것이다. 그리고 f는 초점거리이다! (K 행렬을 구성하는 그 f가 맞다) 우리는 여기서..

    [영상 Geometry] Homogeneous Coordinate에 대해

    [영상 Geometry] Homogeneous Coordinate에 대해

    이번에는 Homogeneous Coordinate에 대해 포스팅해보려고 한다. 서론 이전 게시글 2022.07.19 - [Computer Vision💖/영상처리] - [영상 Geometry] 2D & 3D Transformation(변환)에 대해 에서 2D/3D transformation에 대해 포스팅했다. 이를 통해 우리는 평행이동/회전이동 등의 rigid 변환이 linear하게 나타내질 수 있음을 알았다! 즉, Y=RX+T 형태로 말이다. 하지만 이러한 식 형태에서 +T를 해주는 대신 하나의 행렬 곱으로 나타낼 순 없을까? 당연히 나타낼 수 있다. Homogeneous Coordinate를 이용하면 된다 ~ Homogeneous Coordinate Homogeneous Coordinate는 위 그림처..

    [영상 Geometry] 2D & 3D Transformation(변환)에 대해

    [영상 Geometry] 2D & 3D Transformation(변환)에 대해

    다음은 Homogeneous coordinate와 transformation에 대해 정리해보려고 한다. 아마 한동안은 카메라 관련 게시글을 업로드하지 않을까 싶다 ㅎㅎ 그래도 블로그에 정리해보니 생각 정리가 잘 된다. Transformation(변환) 일단 점 x를 점 x'에 매핑(매칭)하는 함수를 transformation(변환)이라고 한다. 그리고 점과 점을 매핑하는 행위를 확장하면 이미지와 이미지 사이의 매칭 관계를 모델링하는 함수를 나타내는 것이라고 이해할 수 있겠다. 아래와 같이 말이다. 이러한 정의를 잘 이해하는 것이 아래 개념이 와닿는 데에 도움이 많이 될 것 같다. 변환의 종류에는 다음과 같이 여러개의 종류가 있다. 하지만 이 게시글에서는 Translation(평행이동)과 Rotation(..

    [영상 Geometry] 핀홀 카메라 모델과 좌표계에 대해

    [영상 Geometry] 핀홀 카메라 모델과 좌표계에 대해

    오늘은 핀홀카메라 모델과 좌표계에 대해 이해한 내용을 간단히 정리해보려고 한다. 인턴을 시작하면서 카메라에 대해 처음 공부하고 있다. 새롭고 뜻깊은 경험이다! :D 핀홀 카메라 모델 핀홀 카메라 모델은 projection 할 때 사용하는 카메라에 대한 표준 모델이라고 생각하면 된다. 초등학교 때 배운 바늘구멍 카메라와 작동 원리가 유사하다. 아래 그림과 같이 빛을 조그마한 구멍으로 투사시켰을 때 3D 물체가 image plane에서 거꾸로 보이게 된다. 그리고 2d image의 상에서 바늘구멍까지의 거리를 f(초점거리)라고 한다. 이 f는 calibration으로 구할 수 있는 camera intrinsic 중 하나로 변하지 않는 고유값이다. 자율주행에서는 카메라를 주로 사용하고, 이렇게 전방의 3D 물..