ptrace
システムコールにより、親プロセスは接続された子を検査できます。たとえば、Linuxでは、strace
(ptrace
システムコールで実装されます)は、子プロセスによって呼び出されたシステムコールを検査できます。
アタッチされた子プロセスがシステムコールを呼び出すと、トレースする親プロセスに通知できます。しかし、それはどのように正確に起こりますか?このメカニズムの背後にある技術的な詳細を知りたいです。
前もって感謝します。
アタッチされた子プロセスがシステムコールを呼び出すと、トレースする親プロセスに通知できます。しかし、それはどのように正確に起こりますか?
親プロセスは_PTRACE_ATTACH
_でptrace
を呼び出し、彼の子は_PTRACE_TRACEME
_オプションでptrace
を呼び出します。このペアは、 _task_struct
_ ( kernel/ptrace.c:sys_ptrace 内のいくつかのフィールドに入力することにより、2つのプロセスを接続します。子には_PT_PTRACED
_フラグがあります。 _struct task_struct
_のptrace
フィールド、および親としてのptracerプロセスのpidおよび_ptrace_entry
_リスト- ___ptrace_link
_ ;親は子のpidをptraced
リストに記録します)。
次に、straceは_PTRACE_SYSCALL
_フラグを指定してptrace
を呼び出し、それ自体をsyscallデバッガーとして登録し、子プロセスの_TIF_SYSCALL_TRACE
_にthread_flag _struct thread_info
_を設定します(set_tsk_thread_flag(child, TIF_SYSCALL_TRACE);
など)。 _Arch/x86/include/asm/thread_info.h
_ :
_ 67 /*
68 * thread information flags
69 * - these are process state flags that various Assembly files
70 * may need to access ...*/
75 #define TIF_SYSCALL_TRACE 0 /* syscall trace active */
99 #define _TIF_SYSCALL_TRACE (1 << TIF_SYSCALL_TRACE)
_
すべてのsyscallエントリまたは出口で、アーキテクチャ固有のsyscallエントリコードがこれをチェックします __TIF_SYSCALL_TRACE
_フラグ (syscallのアセンブラ実装で直接、たとえばx86 _Arch/x86/kernel/entry_32.S
_ :ENTRY(system_call)
の_jnz syscall_trace_entry
_および _syscall_exit_work
_ )の同様のコード、および設定されている場合、ptracerはシグナル(SIGTRAP)および子供は一時的に停止されます。これは通常 _syscall_trace_enter
_ および_syscall_trace_leave
_で行われます:
_1457 long syscall_trace_enter(struct pt_regs *regs)
1483 if ((ret || test_thread_flag(TIF_SYSCALL_TRACE)) &&
1484 tracehook_report_syscall_entry(regs))
1485 ret = -1L;
1507 void syscall_trace_leave(struct pt_regs *regs)
1531 if (step || test_thread_flag(TIF_SYSCALL_TRACE))
1532 tracehook_report_syscall_exit(regs, step);
_
_tracehook_report_syscall_*
_はここでは実際の労働者であり、_ptrace_report_syscall
_と呼ばれます。 _include/linux/tracehook.h
_ :
_ 80 /**
81 * tracehook_report_syscall_entry - task is about to attempt a system call
82 * @regs: user register state of current task
83 *
84 * This will be called if %TIF_SYSCALL_TRACE has been set, when the
85 * current task has just entered the kernel for a system call.
86 * Full user register state is available here. Changing the values
87 * in @regs can affect the system call number and arguments to be tried.
88 * It is safe to block here, preventing the system call from beginning.
89 *
90 * Returns zero normally, or nonzero if the calling Arch code should abort
91 * the system call. That must prevent normal entry so no system call is
92 * made. If @task ever returns to user mode after this, its register state
93 * is unspecified, but should be something harmless like an %ENOSYS error
94 * return. It should preserve enough information so that syscall_rollback()
95 * can work (see asm-generic/syscall.h).
96 *
97 * Called without locks, just after entering kernel mode.
98 */
99 static inline __must_check int tracehook_report_syscall_entry(
100 struct pt_regs *regs)
101 {
102 return ptrace_report_syscall(regs);
103 }
104
105 /**
106 * tracehook_report_syscall_exit - task has just finished a system call
107 * @regs: user register state of current task
108 * @step: nonzero if simulating single-step or block-step
109 *
110 * This will be called if %TIF_SYSCALL_TRACE has been set, when the
111 * current task has just finished an attempted system call. Full
112 * user register state is available here. It is safe to block here,
113 * preventing signals from being processed.
114 *
115 * If @step is nonzero, this report is also in lieu of the normal
116 * trap that would follow the system call instruction because
117 * user_enable_block_step() or user_enable_single_step() was used.
118 * In this case, %TIF_SYSCALL_TRACE might not be set.
119 *
120 * Called without locks, just before checking for pending signals.
121 */
122 static inline void tracehook_report_syscall_exit(struct pt_regs *regs, int step)
123 {
...
130
131 ptrace_report_syscall(regs);
132 }
_
そして _ptrace_report_syscall
_は_ptrace_notify
_/_ptrace_do_notify
_を介してデバッガーまたはstrace用にSIGTRAP を生成します:
_ 55 /*
56 * ptrace report for syscall entry and exit looks identical.
57 */
58 static inline int ptrace_report_syscall(struct pt_regs *regs)
59 {
60 int ptrace = current->ptrace;
61
62 if (!(ptrace & PT_PTRACED))
63 return 0;
64
65 ptrace_notify(SIGTRAP | ((ptrace & PT_TRACESYSGOOD) ? 0x80 : 0));
66
67 /*
68 * this isn't the same as continuing with a signal, but it will do
69 * for normal use. strace only continues with a signal if the
70 * stopping signal is not SIGTRAP. -brl
71 */
72 if (current->exit_code) {
73 send_sig(current->exit_code, current, 1);
74 current->exit_code = 0;
75 }
76
77 return fatal_signal_pending(current);
78 }
_
_ptrace_notify
_は _kernel/signal.c
_ に実装されており、子を停止してsig_infoをptracerに渡します。
_1961 static void ptrace_do_notify(int signr, int exit_code, int why)
1962 {
1963 siginfo_t info;
1964
1965 memset(&info, 0, sizeof info);
1966 info.si_signo = signr;
1967 info.si_code = exit_code;
1968 info.si_pid = task_pid_vnr(current);
1969 info.si_uid = from_kuid_munged(current_user_ns(), current_uid());
1970
1971 /* Let the debugger run. */
1972 ptrace_stop(exit_code, why, 1, &info);
1973 }
1974
1975 void ptrace_notify(int exit_code)
1976 {
1977 BUG_ON((exit_code & (0x7f | ~0xffff)) != SIGTRAP);
1978 if (unlikely(current->task_works))
1979 task_work_run();
1980
1981 spin_lock_irq(¤t->sighand->siglock);
1982 ptrace_do_notify(SIGTRAP, exit_code, CLD_TRAPPED);
1983 spin_unlock_irq(¤t->sighand->siglock);
1984 }
_
_ptrace_stop
_は同じ_signal.c
_ファイルの3.13の1839行目にあります。