Как считать все строки кода в каталоге рекурсивно?

У нас есть приложение PHP и мы хотим подсчитать все строки кода под определенным каталогом и его подкаталогами. Нам не нужно игнорировать комментарии, так как мы просто пытаемся получить приблизительную идею.

wc -l *.php

Эта команда отлично работает в пределах заданного каталога, но игнорирует подкаталоги. Я думал, что это может сработать, но оно возвращается 74, что определенно не так...

find . -name '*.php' | wc -l

Какой правильный синтаксис для подачи во всех файлах?

Ответ 1

Попробуйте:

find . -name '*.php' | xargs wc -l

Также может помочь инструмент SLOCCount.

Это даст точные исходные строки кода для любого иерархия, на которую вы указываете, а также некоторые дополнительные характеристики.

Сортированный вывод: find . -name '*.php' | xargs wc -l | sort -nr

Ответ 2

Для другого однострочного:

( find ./ -name '*.php' -print0 | xargs -0 cat ) | wc -l

работает с именами с пробелами, выводит только одно число.

Ответ 3

Если использовать по-прежнему последнюю версию Bash (или ZSH), она намного проще:

wc -l **/*.php

В оболочке Bash для этого требуется установить параметр globstar, в противном случае оператор ** glob не является рекурсивным. Чтобы включить этот параметр, выполните

shopt -s globstar

Чтобы сделать это постоянным, добавьте его в один из файлов инициализации (~/.bashrc, ~/.bash_profile и т.д.).

Ответ 4

Вы можете использовать утилиту cloc которая создана именно для этой цели. Он сообщает каждому количество строк на каждом языке, а также количество комментариев и т.д. CLOC доступен в Linux, Mac и Windows.

Пример использования и вывода:

$ cloc --exclude-lang=DTD,Lua,make,Python .
    2570 text files.
    2200 unique files.                                          
    8654 files ignored.

http://cloc.sourceforge.net v 1.53  T=8.0 s (202.4 files/s, 99198.6 lines/s)
-------------------------------------------------------------------------------
Language                     files          blank        comment           code
-------------------------------------------------------------------------------
Javascript                    1506          77848         212000         366495
CSS                             56           9671          20147          87695
HTML                            51           1409            151           7480
XML                              6           3088           1383           6222
-------------------------------------------------------------------------------
SUM:                          1619          92016         233681         467892
-------------------------------------------------------------------------------

Ответ 5

В UNIX-подобных системах есть инструмент под названием cloc, который предоставляет статистику кода.

Я запустил случайную директорию в нашей базе кода, в которой говорится:

      59 text files.
      56 unique files.                              
       5 files ignored.

http://cloc.sourceforge.net v 1.53  T=0.5 s (108.0 files/s, 50180.0 lines/s)
-------------------------------------------------------------------------------
Language                     files          blank        comment           code
-------------------------------------------------------------------------------
C                               36           3060           1431          16359
C/C++ Header                    16            689            393           3032
make                             1             17              9             54
Teamcenter def                   1             10              0             36
-------------------------------------------------------------------------------
SUM:                            54           3776           1833          19481
-------------------------------------------------------------------------------

Ответ 6

Вы не указали, сколько там файлов или какой желаемый результат. Это то, что вы ищите:

find . -name '*.php' | xargs wc -l

Ответ 7

Еще один вариант :)

$ find . -name '*.php' | xargs cat | wc -l

Изменение: это даст общую сумму, а не файл за файлом.

Edit2: добавить . после find чтобы заставить его работать

Ответ 8

Удивительно, но нет ответа на основе find -exec и awk. Вот так:

find . -type f -exec wc -l {} \; | awk '{ SUM += $0} END { print SUM }'

Этот фрагмент находит все файлы (-type f). Чтобы найти по расширению файла, используйте -name:

find . -name '*.py' -exec wc -l '{}' \; | awk '{ SUM += $0; } END { print SUM; }'

Ответ 9

POSIX

В отличие от большинства других ответов здесь, они работают в любой системе POSIX, для любого количества файлов и с любыми именами файлов (кроме отмеченных).

Строки в каждом файле:

find . -name '*.php' -type f -exec wc -l {} \;
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} +

Строки в каждом файле, отсортированные по пути к файлу

find . -name '*.php' -type f | sort | xargs -L1 wc -l
# for files with spaces or newlines, use the non-standard sort -z
find . -name '*.php' -type f -print0 | sort -z | xargs -0 -L1 wc -l

Строки в каждом файле, отсортированные по количеству строк по убыванию

find . -name '*.php' -type f -exec wc -l {} \; | sort -nr
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} + | sort -nr

Всего строк во всех файлах

find . -name '*.php' -type f -exec cat {} + | wc -l

Ответ 10

Для подсчета строк кода в каталоге есть небольшой инструмент sloccount. Следует отметить, что он делает больше, чем вы хотите, поскольку он игнорирует пустые строки/комментарии, группирует результаты на язык программирования и вычисляет некоторые статистические данные.

Ответ 11

Более распространенный и простой, как для меня, предположим, что вам нужно подсчитывать файлы с разными расширениями имен (скажем, также нативными)

wc $(find . -type f | egrep "\.(h|c|cpp|php|cc)" )

Спасибо за отзыв, я исправил его.

Ответ 12

То, что вы хотите, это просто for цикла:

total_count=0
for file in $(find . -name *.php -print)
do
    count=$(wc -l $file)
    let total_count+=count
done
echo "$total_count"

Ответ 13

только для источников:

wc `find`

для фильтрации, просто используйте grep

wc `find | grep .php$`

Ответ 14

Простое, быстрое, будет использовать все возможности поиска/фильтрации find, не сработает, если слишком много файлов (переполнение числа аргументов), отлично работать с файлами со смешными символами в их имени, без используя xargs, не запускает бесполезно большое количество внешних команд (благодаря + для find -exec). Вот вы:

find . -name '*.php' -type f -exec cat -- {} + | wc -l

Ответ 15

Вы также можете попробовать CLOC (требуется Perl)

Ответ 16

Я знаю, что вопрос отмечен как bash, но кажется, что проблема, которую вы пытаетесь решить, также связана с PHP.

Себастьян Бергманн написал инструмент под названием PHPLOC, который делает то, что вы хотите, и, кроме того, дает вам обзор сложности проекта. Это пример его отчета:

Size
  Lines of Code (LOC)                            29047
  Comment Lines of Code (CLOC)                   14022 (48.27%)
  Non-Comment Lines of Code (NCLOC)              15025 (51.73%)
  Logical Lines of Code (LLOC)                    3484 (11.99%)
    Classes                                       3314 (95.12%)
      Average Class Length                          29
      Average Method Length                          4
    Functions                                      153 (4.39%)
      Average Function Length                        1
    Not in classes or functions                     17 (0.49%)

Complexity
  Cyclomatic Complexity / LLOC                    0.51
  Cyclomatic Complexity / Number of Methods       3.37

Как вы можете видеть, предоставленная информация намного более полезна с точки зрения разработчика, потому что она может примерно рассказать вам, насколько сложным является проект, прежде чем вы начнете работать с ним.

Ответ 17

Угадав, что никто никогда не увидит, что это похоронено сзади... Тем не менее, ни один из ответов до сих пор не сталкивается с проблемой имен файлов с пробелами. Кроме того, все, использующие xargs, терпят неудачу, если общая длина путей в дереве превышает ограничение по размеру оболочки оболочки (по умолчанию - несколько мегабайт в Linux). Вот тот, который исправляет эти проблемы довольно прямо. Подоболочка заботится о файлах с пробелами. awk суммирует поток отдельных файлов wc, поэтому никогда не должно заканчиваться пространство. Он также ограничивает файлы exec только файлами (пропусками каталогов):

find . -type f -name '*.php' -exec bash -c 'wc -l "$0"' {} \; | awk '{s+=$1} END {print s}'

Ответ 18

WC -L? лучше использовать GREP -C ^

wc -l? Неправильно! Команда wc подсчитывает новые коды строк, строки не! Когда последняя строка в файле не заканчивается новым кодом строки, это не будет считаться!

если вам все еще нужны строки подсчета, используйте grep -c ^, полный пример:

#this example prints line count for all found files
total=0
find /path -type f -name "*.php" | while read FILE; do
     #you see use grep instead wc ! for properly counting
     count=$(grep -c ^ < "$FILE")
     echo "$FILE has $count lines"
     let total=total+count #in bash, you can convert this for another shell
done
echo TOTAL LINES COUNTED:  $total

наконец, обратите внимание на wc -l trap (количество входящих, а не строк!!!)

Ответ 19

Если вы хотите, чтобы ваши результаты сортировались по количеству строк, вы можете просто добавить | sort или | sort -r (-r для убывающего порядка) к первому ответу, например:

find . -name '*.php' | xargs wc -l | sort -r

Ответ 20

Что-то другое:

wc -l `tree -if --noreport | grep -e'\.php$'`

Это отлично работает, но в текущей папке или одной из ее подпапок вам нужно иметь хотя бы один файл *.php, иначе wc stalls

Ответ 21

Это очень легко с zsh globs:

wc -l ./**/*.php

Если вы используете Bash, вам просто нужно обновить. Нет абсолютно никакой причины использовать bash.

Ответ 22

очень просто

find /path -type f -name "*.php" | while read FILE
do
    count=$(wc -l < $FILE)
    echo "$FILE has $count lines"
done

Ответ 23

Если вам нужно всего лишь общее количество строк, пусть говорят ваши PHP файлы, вы можете использовать очень простую однострочную команду даже под Windows, если у вас установлен GnuWin32. Вот так:

cat `/gnuwin32/bin/find.exe . -name *.php` | wc -l

Вам нужно указать, где именно находится find.exe, иначе Windows, на которой FIND.EXE(из старых DOS-подобных команд) будет выполняться, поскольку это, вероятно, до GnuWin32 в среде PATH и имеет разные параметры и результаты.

Обратите внимание, что в приведенной выше команде вы должны использовать обратные кавычки, а не одинарные кавычки.

Ответ 24

Выдавать самые длинные файлы (т.е. возможно, эти длинные файлы нуждаются в некоторой рефакторинговой любви?) и исключая некоторые каталоги поставщиков:

 find . -name '*.php' | xargs wc -l | sort -nr | egrep -v "libs|tmp|tests|vendor" | less

Ответ 25

Для Windows простой и быстрый инструмент LocMetrics.

Ответ 26

Вам не нужны все эти сложные и трудно запоминающиеся команды. Вам просто нужен инструмент с именем line-counter.

Быстрый обзор

Вот как вы получаете инструмент

$ pip install line-counter

Используйте команду line, чтобы получить количество файлов и количество строк в текущем каталоге (рекурсивно)

$ line
Search in /Users/Morgan/Documents/Example/
file count: 4
line count: 839

Если вы хотите более подробно, просто используйте line -d.

$ line -d
Search in /Users/Morgan/Documents/Example/
Dir A/file C.c                                             72
Dir A/file D.py                                           268
file A.py                                                 467
file B.c                                                   32
file count: 4
line count: 839

И лучшая часть этого инструмента, вы можете добавить к нему .gitignore как файл конфигурации. Вы можете настроить правила, чтобы выбирать или игнорировать, какие файлы следует считать так же, как и то, что вы делаете в '.gitignore'.

Больше описания и использования здесь: https://github.com/MorganZhang100/line-counter

Ответ 27

Если вы работаете в Linux (и я так понимаю), я рекомендую мой инструмент polyglot. Это значительно быстрее, чем sloccount или cloc и это более функционально, чем sloccount.

Вы можете вызвать его с

poly .

или же

poly

так что это гораздо более удобный для пользователя, чем какой-то замысловатый скрипт bash.

Ответ 28

В OS X, по крайней мере, команды find + xarg + wc, перечисленные в некоторых других ответах, печатают "total" несколько раз в больших списках, и нет полной полной информации. Я смог получить одно общее количество файлов .c, используя следующую команду:

find . -name '*.c' -print0 |xargs -0 wc -l|grep -v total|awk '{ sum += $1; } END { print "SUM: " sum; }'

Ответ 29

Я использовал этот inline- script, который я запускаю из каталога src-project:

 for i in $(find . -type f); do rowline=$(wc -l $i | cut -f1 -d" "); file=$(wc -l $i | cut -f2 -d" "); lines=$((lines + rowline)); echo "Lines["$lines"] " $file "has "$rowline"rows."; done && unset lines

Это производит этот вывод:

Lines[75]  ./Db.h has 75rows.
Lines[143]  ./Db.cpp has 68rows.
Lines[170]  ./main.cpp has 27rows.
Lines[294]  ./Sqlite.cpp has 124rows.
Lines[349]  ./Sqlite.h has 55rows.
Lines[445]  ./Table.cpp has 96rows.
Lines[480]  ./DbError.cpp has 35rows.
Lines[521]  ./DbError.h has 41rows.
Lines[627]  ./QueryResult.cpp has 106rows.
Lines[717]  ./QueryResult.h has 90rows.
Lines[828]  ./Table.h has 111rows.

Ответ 30

в то время как мне нравятся сценарии, которые я предпочитаю, так как он также показывает сводку для каждого файла, если общий

wc -l `find . -name "*.php"`