하위 디렉터리의 파일이 변경 되었는지 감지하기
특정 디렉토리 내에서 파일이 변경된 걸 감지해야 하는 경우가 가끔 생긴다.
윈도우즈에서는 FindFirstChangeNotification과 그 패밀리 함수들을 통해서 이를 쉽게 확인할 수 있다.
감시하고 싶은 디렉터리의 바로 하위 디렉터리 뿐만 아니라, 모든 하위 디렉터리까지 알림을 받을 수 있도록 API가 설계되어져 있다.
FindFirstChangeNotification
은 파일 변경 알림을 위한 커널 오브젝트를 만들어서 돌려주는 함수이며, 다른 여느 커널 오브젝트들을 사용하듯이, 그저 생성한 뒤 시그널 되기를(파일이 변경되기를) 기다리면 된다.
WaitForSingleObject 패밀리 함수들을 이용해서 말이다.
그럼 디렉터리의 어떤 파일이 어떻게 변경되었는지도 알 수 있을까?
FindFirstChangeNotification
함수로는 이를 알 수 없지만 ReadDirectoryChangesW
함수를 이용하면 알 수 있다.
ReadDirectoryChangesW 함수는 다른 함수들과는 다르게 이름 뒤에 W가 붙은 유니코드용 함수만 제공된다.
처음 이 함수를 써보려고 하면 몇 가지 어려움에 부딪치게 된다.
2가지의 지식만 알고 있으면 되는데 첫 번째는 디렉터리의 핸들을 얻는 방법이고, 두 번째는 FILE_NOTIFY_INFORMATION
데이터 구조를 이해하는 것이다.
CreateFile 함수는 파일을 생성하는 것 뿐만아니라, 파일을 열 수도 있으며 디렉터리를 열 수도 있다.
사실 CreateFile
에서 File이란 의미는 VirtualFile을 의미하며, 실제 파일이 아닌 장치들도 CreateFile
을 통해 열어서 I/O를 하게 된다.
CreateFile
을 통해 디렉터리를 열 때는 꼭 FILE_FLAG_BACKUP_SEMANTICS
플래그를 넣어주어야 한다.
FILE_NOTIFY_INFORMATION
구조체는 다음처럼 생겼다. 한 개의 파일 변경에 대한 정보를 담을 수 있는 구조체이며, 내가 넣어준 버퍼에 여러 개의 아래 구조체가 담겨온다.
첫번째 필드인 NextEntryOffset
을 통해 다음 구조체의 오프셋을 가르쳐주는데. 다음 엔트리가 없을 때까지(NextEntryOffset이 0) 하나씩 쭉쭉 읽어오면 되는 것이다.
typedef struct _FILE_NOTIFY_INFORMATION {
DWORD NextEntryOffset;
DWORD Action;
DWORD FileNameLength;
WCHAR FileName[1];
} FILE_NOTIFY_INFORMATION, *PFILE_NOTIFY_INFORMATION;
마지막에 FileName[1]
이라고 적혀있는 것은 가변 크기 데이터를 한 덩어리로 메모리를 할당해서 쓰기 위해 C언어에서 종종 사용되는 기법이다.
이런 경우 가변 길이 변수(FileName[1]
)의 크기를 나타내는 변수(FileNameLength
)가 항상 존재한다.
커널 모드의 많은 서비스 함수들과 유저모드로 노출된 몇몇 API 들에서 저런 데이터 구조를 사용하는데, 이상하게 생기고 어려워 보인다고 그냥 넘어가면 꼭 필요할 때 효율적인 데이터 구조를 만들 수 없을 뿐만 아니라 남이 만들어 놓은 함수들조차 사용할 수 없다.
SetFileInformationByHandle 함수는 비스타 부터 제공되는 강력한 파일 조작 API인데 위와 같은 데이터 구조를 알아야 사용할 수 있다.
이 함수를 통해서 Rename을 하는 부분만 살펴보자.
FIELD_OFFSET
매크로를 어떻게 사용하는지 주목해서 봐야한다.
이 함수에서 입력으로 사용되는 FILE_RENAME_INFO
구조체는 다음과 같이 생겼다.
typedef struct _FILE_RENAME_INFO {
BOOL ReplaceIfExists;
HANDLE RootDirectory;
DWORD FileNameLength;
WCHAR FileName[1];
} FILE_RENAME_INFO, *PFILE_RENAME_INFO;
std::wstring newFileName = L"D:\\newfilename";
HANDLE h = CreateFileW(L"D:\\originfilename", GENERIC_READ|GENERIC_WRITE|DELETE,
FILE_SHARE_READ|FILE_SHARE_WRITE, 0, OPEN_EXISTING, 0, 0);
DWORD cbBuffer = FIELD_OFFSET(FILE_RENAME_INFO, FileName[newFileName.size() + 1]);
PFILE_RENAME_INFO pRenameInfo = (PFILE_RENAME_INFO)malloc(cbBuffer);
pRenameInfo->ReplaceIfExists = FALSE;
pRenameInfo->FileNameLength = newFileName.size() * sizeof(WCHAR);
pRenameInfo->RootDirectory = 0;
StringCchCopyNW(pRenameInfo->FileName,
newFileName.size() + 1, newFileName.c_str(), newFileName.size());
SetFileInformationByHandle(h, FileRenameInfo, pRenameInfo, cbBuffer);
이제 ReadDirectoryChangesW
함수도 이해할 수 있다.
바로 코드를 살펴보자. 잡스런 처리는 하지 않았다.
HANDLE hDir = CreateFileW(L"D:\\", GENERIC_READ, FILE_SHARE_READ|FILE_SHARE_WRITE,
0, OPEN_EXISTING, FILE_FLAG_BACKUP_SEMANTICS, 0);
CONST DWORD cbBuffer = 1024*1024;
BYTE* pBuffer = (PBYTE)malloc(cbBuffer);
BOOL bWatchSubtree = FALSE;
DWORD dwNotifyFilter = FILE_NOTIFY_CHANGE_FILE_NAME | FILE_NOTIFY_CHANGE_DIR_NAME |
FILE_NOTIFY_CHANGE_ATTRIBUTES | FILE_NOTIFY_CHANGE_SIZE |
FILE_NOTIFY_CHANGE_LAST_WRITE | FILE_NOTIFY_CHANGE_CREATION;
DWORD bytesReturned;
WCHAR temp[MAX_PATH] = { 0 };
for(;;)
{
FILE_NOTIFY_INFORMATION* pfni;
BOOL fOk = ReadDirectoryChangesW(hDir, pBuffer, cbBuffer,
bWatchSubtree, dwNotifyFilter, &bytesReturned, 0, 0);
if(!fOk)
{
DWORD dwLastError = GetLastError();
printf("error : %d\n", dwLastError);
break;
}
pfni = (FILE_NOTIFY_INFORMATION*)pBuffer;
do {
printf("NextEntryOffset(%d)\n", pfni->NextEntryOffset);
switch(pfni->Action)
{
case FILE_ACTION_ADDED:
wprintf(L"FILE_ACTION_ADDED\n");
break;
case FILE_ACTION_REMOVED:
wprintf(L"FILE_ACTION_REMOVED\n");
break;
case FILE_ACTION_MODIFIED:
wprintf(L"FILE_ACTION_MODIFIED\n");
break;
case FILE_ACTION_RENAMED_OLD_NAME:
wprintf(L"FILE_ACTION_RENAMED_OLD_NAME\n");
break;
case FILE_ACTION_RENAMED_NEW_NAME:
wprintf(L"FILE_ACTION_RENAMED_NEW_NAME\n");
break;
default:
break;
}
printf("FileNameLength(%d)\n", pfni->FileNameLength);
StringCbCopyNW(temp, sizeof(temp), pfni->FileName, pfni->FileNameLength);
wprintf(L"FileName(%s)\n", temp);
pfni = (FILE_NOTIFY_INFORMATION*)((PBYTE)pfni + pfni->NextEntryOffset);
} while(pfni->NextEntryOffset > 0);
}
위와 같이 변경된 파일의 이름과 어떤 식으로 변경되었는지(파일이 새로 생성되었는지, 시간이 바뀐건지)등의 정보를 모두 얻어낼 수 있다.
함수를 사용하는 법 이외에도 몇 가지 더 알고 있어야 하는 것들이 있다.
ReadDirectoryChangesW
를 호출해서 한번 통지를 받은 후 다시 루프를 도는 동안 파일들이 변경된다면 그 사이 변경된 파일들은 모두 놓치게 되는 것인가?
함수를 통해 통지를 받을 때, 꼭 하나의 파일(혹은 디렉터리)만 튀어나오는 것은 아니라는 점을 명심해야 한다.
파일 시스템 드라이버는 내부에서 버퍼를 따로 할당해서 이 버퍼에 그 동안 변경된 파일들을 계속 모아둔다.
그리고 사용자 쪽에서 통지를 기다리면, 이 내부 버퍼에 쌓인 것들을 전부 사용자 버퍼로 복사 한뒤 I/O를 완료시켜서 사용자 쪽으로 돌려주게 된다.
따라서 혹시 루프가 천천히 돌더라도 그 사이에 변경되는 파일들은 다음 번 호출시에 모두 받을 수 있게된다.
그렇기 때문에 두번째 인자로 제공되는 버퍼에 FILE_NOTIFY_INFORMATION
구조를 여러개 담아 주도록 설계한 것이다.
또한 이 파일 시스템 드라이버의 내부 버퍼는 핸들을 닫을 때까지 유지된다.
즉, 한번 ReadDirectoryChangesW
함수를 호출하고 핸들을 닫지 않은채 그 다음 호출을 안하고 멍하니 있는다면 그 동안 드라이버 내의 내부 버퍼에 변경된 파일 정보들이 계속 쌓이게 될 것이다.
얼마나 쌓이느냐는 파일 시스템 드라이버의 구현에 달려있다.
ReadDirectoryChangesW
함수의 모양을 보면 알 수 있지만 이 함수는 비동기 I/O도 지원을 한다.
디렉터리를 1개만 감시하고 싶을 때는 위에서 한 것 처럼 동기적으로 호출해도 되겠지만, 1개의 쓰레드만 사용하면서 여러 개의 디렉터리들을 감시하고 싶다면 비동기 I/O를 사용하는 것을 고려해봐야 할 것이다.
파일 시스템 드라이버나 네트워크 리디렉터를 만들 때는 위 기능을 직접 구현해주어야 하는데 필수적으로 구현해야 하는 것은 아니다.
구현하지 않는다면 파일이 변경되었을 때 애플리케이션들이 변경되는 파일들을 자동으로 갱신하지 못할 것이므로(ReadDirectoryChangesW
가 실패할 것이다) 구현 하는 쪽이 더 나은 사용자 경험을 제공해 주는 파일 시스템 드라이버가 될 것이다.
함께 읽으면 좋은 글: