서버를 쓰다가 3시간짜리 코드를 1시간 남기고,, 시간 없어서 control + z로 정지했는데,,, 이게 비정상적인 정지로 먹혔나보다.
그래서 이번에 또 glances의 GPU 사용량이 ,,, 또,,, 차있어서 CUDA oom error가 나는거다 ㅠㅠㅠ
교수님한테 맨날 찐같이 가서 ㅠ ㅅ ㅠ 맨날 귀찮게 도커 다시만들어주시고 그랬는데,,, 암튼 ,,, 드디어 해결 방법을 찾았다!
가장 많이 참고한 블로그는 여기다 ㅠ ㅠ
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=neakoo35&logNo=30126659800
우선 ps -ef 로 실행중인 리스트를 확인해봤는데, PID로 일일히 kill 하기에는 너무 많았다. 그리고 kill을 해도 잘 죽지 않는 것 같았다...
그런데 공통적으로 발견했던 것은 문제가 됐던 내 코드의 PPID가 다 똑같은거다. 블로그를 참고하니까 이 PPID는 부모 프로세스라고 한다!
그래서 이 공통된 PPID 좀비프로세스를 kill -9 PPID 로 죽여주면 된다!
그럼 클린하게 돌아가는 코드를 확인할 수 있다 ~_~ 리눅스 찐따에겐 이런 평범한 것도 너무 힘들다,,,
반응형
'Linux' 카테고리의 다른 글
[Linux] 리눅스 ls -alt -h로 파일 사이즈 확인하기 (0) | 2022.06.13 |
---|---|
[Linux] 도커 내에서 리눅스 scp 사용하기 (도커에서 도커로 파일 전송) (0) | 2022.06.13 |
[Linux] 리눅스 wget 사용하기 - 다소 큰 파일을 웹상에서 다운로드 (1) | 2022.05.31 |
[Linux] 리눅스 mv 명령어 - 폴더 이름 바꾸기, 폴더 이동하기 (0) | 2022.04.16 |
[Linux] Remote 서버에서 Tensorboard 연결하기 (1) | 2021.07.19 |