분류 전체보기

    [TIL] cannot find -lopencv_core 에러 해결 - Opencv(C++) 설치하기

    [TIL] cannot find -lopencv_core 에러 해결 - Opencv(C++) 설치하기

    Lane detection 코드를 돌리던 와중 evaluation을 c++ build 후에야 할 수 있다는걸 알게된 오늘의 나.. 통계학과인 나에게 너무 가혹한 evaluation 방식이다 .. ㅎㅎ...... 따라서 어찌저찌 make 파일을 build 하려고 했는데, 다음과 같은 오류를 직면했다. /usr/bin/ld: cannot find -lopencv_core 이 오류의 뜻은 -l 뒤의 패키지가 없다는 뜻이라고 한다. 따라서 opencv가 없는 상황이었고 다음과 같이 설치해주었다. 참고로 설치는 꽤 오래걸린다. # Install minimal prerequisites (Ubuntu 18.04 as reference) sudo apt update && sudo apt install -y cmake ..

    [Generation] 자세한 Pix2pixHD 논문 리뷰 (High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)

    [Generation] 자세한 Pix2pixHD 논문 리뷰 (High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)

    오늘은 인턴에서 자주 접하고 있는 Pix2pixHD(CVPR 17')에 대해 포스팅해보려고 한다. 생성모델은 아직은 익숙치 않지만, 확실히 컴퓨터비전의 꽃이라고 할 만큼 재밌는 분야인 것 같다 ㅎㅎ 그럼 포스팅을 시작해보겠다! 네트워크를 중심으로 정리할 예정이다. 많은 내용을 꾹꾹 눌러담았다! # Motivation 이 글을 읽는 독자들이라면 Pix2pix라는 생성 모델을 한번 쯤 들어본 적이 있을 수도 있을 것 같다. 일단 Pix2pixHD는 high-resolution(고해상도의)한 이미지를 생성해낼 수 있도록 기존 Pix2pix를 변형한 모델이다. 따라서 pix2pix를 밟고 올라오는 모델이라고 생각하면 되겠다. 기존의 pix2pix는 고해상도의 이미지 생성이 어려웠고, global한 생성은 가능하..

    [Python] shutil과 os로 디렉토리, 폴더 조작하기

    [Python] shutil과 os로 디렉토리, 폴더 조작하기

    컴퓨터 비전을 하다보면 디렉토리, 폴더 단위에서 python으로 파일을 나누거나 작업해야할 때가 생긴다. 따라서 간단한 명령어를 정리해놓으려고 한다. :) # 파일 리스트 출력하기 import os os.listdir(path) # 특정 파일의 경로를 다른 곳으로 이동하기 단 이 경우에는 "이동"이므로, 원래 저장소의 파일은 이동되어 존재하지 않게 된다. import shutil shutil.move(현재 파일 경로, 이동할 경로) # 특정 파일의 경로를 다른 곳으로 복사하기 위 경우 말고 원본 저장소에도 파일을 남겨두고 싶을 때는 copy를 하면 된다. import shutil shutil.copy(현재 파일 경로, 이동할 경로)

    [영상 Geometry] FOV(Field Of View)에 대해

    [영상 Geometry] FOV(Field Of View)에 대해

    이번에는 FoV에 대해 포스팅하려고 한다. Camera projection과 관련된 내용이니 잘 알아두면 좋을 것 같아서 정리한다! :) FOV(Field Of View) 일단 FOV(Field Of View)는 카메라가 볼 수 있는 최대 각도라고 생각하면 된다. 핀홀카메라 모델을 가정할 때 아래와 같은 그림이 그려질 수 있다. 카메라와 Image plane을 3차원으로 나타낸 그림이라고 이해하면 된다. 위 그림을 BEV(Bird Eye View) 즉, 위에서 본다고 생각해보자. 그럼 아래와 같은 그림이 그려지게 된다. 위 그림을 해석해보면, 일단 O는 카메라 중심이다. 그리고 맨 아래는 Image plane을 나타낸 것이다. 그리고 f는 초점거리이다! (K 행렬을 구성하는 그 f가 맞다) 우리는 여기서..

    [영상 Geometry] Homogeneous Coordinate에 대해

    [영상 Geometry] Homogeneous Coordinate에 대해

    이번에는 Homogeneous Coordinate에 대해 포스팅해보려고 한다. 서론 이전 게시글 2022.07.19 - [Computer Vision💖/영상처리] - [영상 Geometry] 2D & 3D Transformation(변환)에 대해 에서 2D/3D transformation에 대해 포스팅했다. 이를 통해 우리는 평행이동/회전이동 등의 rigid 변환이 linear하게 나타내질 수 있음을 알았다! 즉, Y=RX+T 형태로 말이다. 하지만 이러한 식 형태에서 +T를 해주는 대신 하나의 행렬 곱으로 나타낼 순 없을까? 당연히 나타낼 수 있다. Homogeneous Coordinate를 이용하면 된다 ~ Homogeneous Coordinate Homogeneous Coordinate는 위 그림처..

    [영상 Geometry] 2D & 3D Transformation(변환)에 대해

    [영상 Geometry] 2D & 3D Transformation(변환)에 대해

    다음은 Homogeneous coordinate와 transformation에 대해 정리해보려고 한다. 아마 한동안은 카메라 관련 게시글을 업로드하지 않을까 싶다 ㅎㅎ 그래도 블로그에 정리해보니 생각 정리가 잘 된다. Transformation(변환) 일단 점 x를 점 x'에 매핑(매칭)하는 함수를 transformation(변환)이라고 한다. 그리고 점과 점을 매핑하는 행위를 확장하면 이미지와 이미지 사이의 매칭 관계를 모델링하는 함수를 나타내는 것이라고 이해할 수 있겠다. 아래와 같이 말이다. 이러한 정의를 잘 이해하는 것이 아래 개념이 와닿는 데에 도움이 많이 될 것 같다. 변환의 종류에는 다음과 같이 여러개의 종류가 있다. 하지만 이 게시글에서는 Translation(평행이동)과 Rotation(..

    [영상 Geometry] 핀홀 카메라 모델과 좌표계에 대해

    [영상 Geometry] 핀홀 카메라 모델과 좌표계에 대해

    오늘은 핀홀카메라 모델과 좌표계에 대해 이해한 내용을 간단히 정리해보려고 한다. 인턴을 시작하면서 카메라에 대해 처음 공부하고 있다. 새롭고 뜻깊은 경험이다! :D 핀홀 카메라 모델 핀홀 카메라 모델은 projection 할 때 사용하는 카메라에 대한 표준 모델이라고 생각하면 된다. 초등학교 때 배운 바늘구멍 카메라와 작동 원리가 유사하다. 아래 그림과 같이 빛을 조그마한 구멍으로 투사시켰을 때 3D 물체가 image plane에서 거꾸로 보이게 된다. 그리고 2d image의 상에서 바늘구멍까지의 거리를 f(초점거리)라고 한다. 이 f는 calibration으로 구할 수 있는 camera intrinsic 중 하나로 변하지 않는 고유값이다. 자율주행에서는 카메라를 주로 사용하고, 이렇게 전방의 3D 물..

    [Seg] 간단히 알아보는 Segmentation, Segmentation map

    [Seg] 간단히 알아보는 Segmentation, Segmentation map

    오늘은 간단히 Sementic Segmentation에 대해 포스팅해보려고 한다! 아래에 해당되는 독자분들이라면 본 게시글이 도움이 될 수 있겠다. 😉🤖 그럼 차근차근 시작해보자. 예상 독자 1. 컴퓨터 비전의 Segmentation에 대한 이해가 처음이신분 # Segmentation 이란? 우선 컴퓨터비전에서 Segmentation이란 image의 픽셀별로 모든 레이블을 예측하는 분야이다. 보통 classification이나 detection의 경우에는 픽셀 단위로 무언가를 예측하지는 않는다. (최종 예측을 위해 픽셀 단위의 정보를 이용할 뿐이다!) 하지만 Segmentation은 이들과 다르게 조금 더 픽셀 단위의 세밀한 예측을 진행한다. 아래 사진을 보자. 위 사진에서 오른쪽을 보면, 픽셀별로 라벨..