Благодаря полезным предложениям ниже:
Итак, это кажется фиксированным, когда I
- отдельные команды для индивидуальных вызовов в Popen
- stderr = subprocess.PIPE как аргумент для каждой цепи Popen.
Новый код:
import subprocess
import shlex
import logging
def run_shell_commands(cmds):
""" Run commands and return output from last call to subprocess.Popen.
For usage see the test below.
"""
# split the commands
cmds = cmds.split("|")
cmds = list(map(shlex.split,cmds))
logging.info('%s' % (cmds,))
# run the commands
stdout_old = None
stderr_old = None
p = []
for cmd in cmds:
logging.info('%s' % (cmd,))
p.append(subprocess.Popen(cmd,stdin=stdout_old,stdout=subprocess.PIPE,stderr=subprocess.PIPE))
stdout_old = p[-1].stdout
stderr_old = p[-1].stderr
return p[-1]
pattern = '"^85567 "'
file = "j"
cmd1 = 'grep %s %s | sort -g -k3 | head -10 | cut -d" " -f2,3' % (pattern, file)
p = run_shell_commands(cmd1)
out = p.communicate()
print(out)
Оригинальное сообщение:
Я слишком долго пытался решить проблему с помощью простого подпроцесса. Popen.
код:
import subprocess
cmd = 'cat file | sort -g -k3 | head -20 | cut -f2,3' % (pattern,file)
p = subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE)
for line in p.stdout:
print(line.decode().strip())
Выход для файла ~ 1000 строк в длину:
...
sort: write failed: standard output: Broken pipe
sort: write error
Выход для файлa > 241 длина строки:
...
sort: fflush failed: standard output: Broken pipe
sort: write error
Выход для файла < 241 строк в порядке.
Я читал docs и googling как сумасшедший, но есть что-то фундаментальное в модуле подпроцесса, который мне не хватает... возможно, с буферами. Я пробовал p.stdout.flush() и играл с размером буфера и p.wait(). Я попытался воспроизвести это с помощью команд типа sleep 20; cat averagefile ', но это, кажется, работает без ошибок.