Подтвердить что ты не робот

Как узнать, является ли функция-член константой или неустойчивой с помощью libclang?

У меня есть экземпляр CXCursor вида CXCursor_CXXMethod. Я хочу узнать, есть ли функция const или volatile, например:

class Foo {
public:
    void bar() const;
    void baz() volatile;
    void qux() const volatile;
};

Я не мог найти ничего полезного в документации libclang. Я пробовал clang_isConstQualifiedType и clang_isVolatileQualifiedType, но они всегда возвращают 0 в типы функций члена С++.

4b9b3361

Ответ 1

Я могу представить два подхода:

Использование libclang lexer

Код, который появляется в этом SO-ответе, работает для меня; он использует токенизатор libclang, чтобы разбить объявление метода отдельно, а затем записывает любые ключевые слова вне круглых скобок метода.

Он не получает доступ к АСТ кода, и, насколько я могу судить, вовсе не связан с парсером. Если вы уверены, что код, который вы исследуете, является правильным С++, я считаю, что этот подход безопасен.

Недостатки: это решение, как представляется, не учитывает директивы предварительной обработки, поэтому сначала необходимо обработать код (например, через cpp).

Пример кода (файл для синтаксического анализа должен быть первым аргументом вашей программы, например ./a.out bla.cpp):

#include "clang-c/Index.h"
#include <string>
#include <set>
#include <iostream>

std::string GetClangString(CXString str)
{
  const char* tmp = clang_getCString(str);
  if (tmp == NULL) {
    return "";
  } else {
    std::string translated = std::string(tmp);
    clang_disposeString(str);
    return translated;
  }
}

void GetMethodQualifiers(CXTranslationUnit translationUnit,
                         std::set<std::string>& qualifiers,
                         CXCursor cursor) {
  qualifiers.clear();

  CXSourceRange range = clang_getCursorExtent(cursor);
  CXToken* tokens;
  unsigned int numTokens;
  clang_tokenize(translationUnit, range, &tokens, &numTokens);

  bool insideBrackets = false;
  for (unsigned int i = 0; i < numTokens; i++) {
    std::string token = GetClangString(clang_getTokenSpelling(translationUnit, tokens[i]));
    if (token == "(") {
      insideBrackets = true;
    } else if (token == "{" || token == ";") {
      break;
    } else if (token == ")") {
      insideBrackets = false;
    } else if (clang_getTokenKind(tokens[i]) == CXToken_Keyword && 
             !insideBrackets) {
      qualifiers.insert(token);
    }
  }

  clang_disposeTokens(translationUnit, tokens, numTokens);
}

int main(int argc, char *argv[]) {
  CXIndex Index = clang_createIndex(0, 0);
  CXTranslationUnit TU = clang_parseTranslationUnit(Index, 0, 
          argv, argc, 0, 0, CXTranslationUnit_None);

  // Set the file you're interested in, and the code location:
  CXFile file = clang_getFile(TU, argv[1]);
  int line = 5;
  int column = 6;
  CXSourceLocation location = clang_getLocation(TU, file, line, column);
  CXCursor cursor = clang_getCursor(TU, location);

  std::set<std::string> qualifiers;
  GetMethodQualifiers(TU, qualifiers, cursor);

  for (std::set<std::string>::const_iterator i = qualifiers.begin(); i != qualifiers.end(); ++i) {
    std::cout << *i << std::endl;
  }

  clang_disposeTranslationUnit(TU);
  clang_disposeIndex(Index);
  return 0;
}

Использование libclang Единое разрешение символа (USR)

Этот подход включает использование самого анализатора и извлечение информации классификатора из АСТ.

Преимущества: Кажется, нужно работать с кодом с препроцессорными директивами, по крайней мере для простых случаев.

Недостатки: Мое решение анализирует USR, который недокументирован, и может измениться в будущем. Тем не менее, легко написать блок-тест для защиты от этого.

Взгляните на $(CLANG_SRC)/tools/libclang/CIndexUSRs.cpp, он содержит код, который генерирует USR, и поэтому содержит информацию, необходимую для синтаксического анализа строки USR. В частности, строки 523-529 (в источнике LLVM 3.1, загруженные из www.llvm.org) для части квалификатора.

Добавьте следующую функцию:

void parseUsrString(const std::string& usrString, bool* isVolatile, bool* isConst, bool *isRestrict) {
  size_t bangLocation = usrString.find("#");
  if (bangLocation == std::string::npos || bangLocation == usrString.length() - 1) {
    *isVolatile = *isConst = *isRestrict = false;
    return;
  }
  bangLocation++;
  int x = usrString[bangLocation];

  *isConst = x & 0x1;
  *isVolatile = x & 0x4;
  *isRestrict = x & 0x2;
}

и в main(),

CXString usr = clang_getCursorUSR(cursor);
const char *usr_string = clang_getCString(usr);
std::cout << usr_string << "\n";
bool isVolatile, isConst, isRestrict;
parseUsrString(usr_string, &isVolatile, &isConst, &isRestrict);
printf("restrict, volatile, const: %d %d %d\n", isRestrict, isVolatile, isConst);
clang_disposeString(usr);

Запуск на Foo::qux() из

#define BLA const

class Foo {
public:
    void bar() const;
    void baz() volatile;
    void qux() BLA volatile;
};

дает ожидаемый результат

c:@[email protected]@[email protected]#5
restrict, volatile, const: 0 1 1

Предостережение: вы могли заметить, что libclang источник рекомендует, что мой код должен быть isVolatile = x & 0x2, а не 0x4, поэтому может потребоваться заменить 0x4 на 0x2. Возможно, моя реализация (OS X) заменила их.