说,我有两条绝对路径。我需要检查其中一个路径引用的位置是否是另一个路径的后代。如果为真,我需要从祖先中找出后代的相对路径。在 Python 中实现这个的好方法是什么?我可以从中受益的任何图书馆?
最佳答案
os.path.commonprefix()和 os.path.relpath()是你的 friend 吗:
>>> print os.path.commonprefix(['/usr/var/log', '/usr/var/security'])
'/usr/var'
>>> print os.path.commonprefix(['/tmp', '/usr/var']) # No common prefix: the root is the common prefix
'/'
因此,您可以测试公共(public)前缀是否是路径之一,即路径之一是否是共同祖先:
paths = […, …, …]
common_prefix = os.path.commonprefix(list_of_paths)
if common_prefix in paths:
…
然后您可以找到相对路径:
relative_paths = [os.path.relpath(path, common_prefix) for path in paths]
您甚至可以使用此方法处理两个以上的路径,并测试所有路径是否都在其中一个之下。
PS:根据路径的外观,您可能需要先执行一些规范化(这在人们不知道它们是否总是以'/'结尾的情况下很有用,或者如果某些路径是相对的)。相关功能包括os.path.abspath()和 os.path.normpath() .
PPS:正如评论中提到的 Peter Briggs,上述简单方法可能会失败:
>>> os.path.commonprefix(['/usr/var', '/usr/var2/log'])
'/usr/var'
即使 /usr/var
不是 路径的公共(public)前缀。在调用 commonprefix()
之前强制所有路径以 '/' 结尾可以解决这个(特定)问题。
PPPS:正如 bluenote10 提到的,添加斜线并不能解决一般问题。这是他的后续问题:How to circumvent the fallacy of Python's os.path.commonprefix?
PPPPS:从 Python 3.4 开始,我们有 pathlib ,一个提供更健全的路径操作环境的模块。我猜想一组路径的公共(public)前缀可以通过获取每条路径的所有前缀(带有 PurePath.parents()
),取所有这些父集的交集,并选择最长的公共(public)前缀来获得。
PPPPPS:Python 3.5 为这个问题引入了适当的解决方案:os.path.commonpath()
,它返回一个有效的路径。
https://stackoverflow.com/questions/7287996/