私はこれのためのPythonic関数が何であるか知りたかったです:
wa
パスの前のすべてを削除したい。
p = path.split('/')
counter = 0
while True:
if p[counter] == 'wa':
break
counter += 1
path = '/'+'/'.join(p[counter:])
たとえば、'/book/html/wa/foo/bar/'
になる'/wa/foo/bar/'
。
より良い答えは、os.path.relpathを使用することです。
http://docs.python.org/2/library/os.path.html#os.path.relpath
>>> import os
>>> full_path = '/book/html/wa/foo/bar/'
>>> print os.path.relpath(full_path, '/book/html')
'wa/foo/bar'
>>> path = '/book/html/wa/foo/bar/'
>>> path[path.find('/wa'):]
'/wa/foo/bar/'
Python 3.4+の場合、 pathlib.PurePath.relative_to を使用する必要があります。ドキュメントから:
>>> p = PurePosixPath('/etc/passwd')
>>> p.relative_to('/')
PurePosixPath('etc/passwd')
>>> p.relative_to('/etc')
PurePosixPath('passwd')
>>> p.relative_to('/usr')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pathlib.py", line 694, in relative_to
.format(str(self), str(formatted)))
ValueError: '/etc/passwd' does not start with '/usr'
質問へのより多くの回答については、 このStackOverflowの質問 も参照してください。
import re
path = '/book/html/wa/foo/bar/'
m = re.match(r'.*(/wa/[a-z/]+)',path)
print m.group(1)