pyDicom 과 오픈 소스가 많아서 dcm 이미지를 바로 부를 수 있었다. 문제는 학습을 돌리는데 그래프가 좀처럼 올라가지 않는 것이었다. 그래서 다운 받은 파일을 온라인 dcm 뷰어로 열어보니... 동일 X-ray만 모두 둔게 아니었다. 우선, 의학 지식이 없어 X-ray를 볼 줄 모르는 것도 문제였다. 받은 자료의 폴더 하나가 하나의 환자 혹은 시간 단위의 같은 환자 일 수 있었고, 해당 폴더는 2개로 나누어 지는데 그 중 하나는 MRI 같았다. 여러장을 볼 때 특정한 위치의 몇 장에서 breast 모양이 약간 나오는 것으로 봐서는 X-ray가 여러 층으로 되어 있는 것 같았다.(그래서 MRI라고 추측 해봄)
자료 출처가 있는 곳으로 가서 설명을 자세히 보면 되겠다. 아래 쪽 폴더의 X-ray(좌측 검은색 물체가 약간 보이는)는 당최 뭔지 모르니 train data에서 빼야 겠다는 생각이 들었다. 그리고 환자별 MRI가 모두 암 환자의 MRI가 맞다면, 암이 보이는 X-ray가 가슴모양이 그나마 나오는
여기서 암이 다 보이는 것인지 알아 봐야 했다. 그래야 일단 비슷한 분류끼리 모아서 한 번에 학습을 시킬텐데 말이다.
전문의 한테 물어봐야 하는 단계에 왔다. 상식적으로 생각해봐도 X-ray는 단층이라 x, y만 있으니 암세포는 z축으로 자랄 수도 있을 것 같다. 그래서 당연히 모든 X-ray 를 봐야 할 것 같다. 이 정도 진행을 해 보니 차라리 학습 전에 2D 만으로 3D를 구성하고 암세포가 있는 해당 3D 파일 구조에서 암세포를 학습 시키는 것이 더 나을 것 같다는 생각도 들었다.
이러니 IBM 왓슨 암 진달률이 떨어져서 요즘 병원에서 점차 물러나고 있는 추세 인 것 같다. 동양인 서양인 데이터도 다르다고 하던데 그 부분도 검증을 해 봐야 하고 말이다.
의료 분야는 정말 생각할게 많네. ㅡㅡ;
다행히 아는 전문의가 있고 자주 기술 문제 문의로 전화를 주시기 때문에 의료 데이터에 대해서 여쭤볼 수 있을 것 같다. 가슴 쪽 말고 다른 CT를 좀 보다보면 세웠던 가설에 대한 검증도 될 것 같지만 전문가는 만나서 물어보는게 최고지. 다음 주 술 자리만 3개라... 2주 쯤 걸릴 것 같다.
암이던 아니던 어느 부위인지 자동 인식 하는 분류부터 만들고 들어가면 더 쉽겠네.
'[진행] 건강 자료 수집 "해볼까?"' 카테고리의 다른 글
편두통 (0) | 2020.07.17 |
---|---|
pydicom (0) | 2020.07.02 |
자료 받기 (0) | 2020.06.26 |
The result of Naver crawling is useless. (0) | 2020.06.25 |
Breast cancer (0) | 2020.06.24 |
최근댓글