Run states
다음 표는 run 이 가질 수 있는 가능한 상태들을 설명합니다:| State | Description |
|---|---|
Crashed | 내부 프로세스에서 heartbeat 전송이 중단된 상태입니다. 이는 주로 머신이 충돌(crash)할 때 발생합니다. |
Failed | run 이 0이 아닌 종료 상태 코드(exit status)로 종료되었습니다. |
Finished | run 이 종료되어 데이터 동기화가 완전히 완료되었거나, wandb.Run.finish() 가 호출되었습니다. |
Killed | run 이 완료되기 전에 강제로 중단되었습니다. |
Running | run 이 여전히 실행 중이며 최근에 heartbeat 를 보냈습니다. |
Pending | run 이 예약되었지만 아직 시작되지 않았습니다 (Sweeps 및 Launch 작업에서 흔히 발생). |
Run states in sweeps
Run 이 sweep 의 일부인 경우, 각 run 의 상태는 sweep 의 상태와 독립적으로 작동합니다:- 개별 run 상태는 각 run 의 실행 상태(Running, Finished, Failed 등)를 반영합니다.
- Sweep status는 새로운 run 의 생성 여부를 제어하며, 기존 run 의 실행 방식에는 영향을 주지 않습니다.
- sweep 을 일시 중지하거나 중지해도 이미 실행 중인 run 에는 영향을 미치지 않습니다.
- sweep 을 취소할 때만 실행 중인 run 이 강제로 종료됩니다 (상태가
Killed로 변경됨).
View the state of a run
Python SDK 또는 W&B 앱을 사용하여 프로그래밍 방식 또는 대화형으로 run 의 상태를 확인할 수 있습니다.- Python SDK
- W&B App
wandb.Api.Run 오브젝트의 state 속성을 사용하여 run 의 현재 상태에 엑세스합니다.다음 코드조각은 지정된 프로젝트 내의 모든 run 상태를 가져와서 출력합니다. 다음 코드조각을 복사하여 Python 환경에 붙여넣으세요. 꺾쇠괄호 (< >)로 묶인 값들을 실제 값으로 바꿉니다: