Как избежать людей, использующих мой код для зла?

Я не уверен, что это подходящее место, но кажется, что это достойное место, чтобы спросить.

Моя текущая работа включает ручной анализ больших наборов данных (на нескольких уровнях, каждый более совершенный и сделанный опытными аналитиками). Около года назад я начал разрабатывать некоторые утилиты для отслеживания эффективности аналитиков, сравнивая результаты на более ранних уровнях с конечными уровнями. Сначала это работало довольно хорошо - мы использовали его в магазине в качестве простого индикатора, чтобы помочь сосредоточить усилия по обучению и сделать лучшую работу в целом.

В последнее время результаты были взяты из контекста и использованы таким образом, который я никогда не планировал. Кажется, что руководство (в частности, один человек) приступило к использованию результатов этих инструментов, чтобы напрямую повлиять на EPR (заверенные отчеты о производительности - это сила, но я предполагаю, что что-то подобное существует в других областях) и аналогичные документы. Проблема заключается не в том, кто использует эти результаты, но как. Я ясно дал понять всем, что результаты, довольно просто, подвержены ошибкам.

Существует множество неизбежных препятствий для создания этих данных, которые я сработал, чтобы свести к минимуму некоторые изящные эвристики и тому подобное. Взятые в надлежащем контексте, они являются полезным инструментом. Однако из контекста, поскольку они используются сейчас, они приносят больше вреда, чем пользы.

Управляющий (ы), о котором идет речь, принимает результаты как литологические показатели того, работает ли аналитик хорошо или плохо. Результаты усредняются, и отдельные оценки оцениваются как выше (хорошо), так и ниже (плохое) среднее. Это делается без учета присущих ошибкам погрешности и выборки, без учета какой-либо надлежащей интерпретации. Я знаю, по крайней мере, одного человека, рейтинг производительности которого был отмечен за "процент точности" менее одного процентного пункта ниже среднего (когда типичная погрешность только от метода расчета составляет от двух до трех процентов).

Я готов написать официальный отчет об ошибках, присутствующих в системе (включая "Руководство для начинающих к значащему статистическому анализу" ), но все признаки указывают на то, что это не имеет никакого эффекта.

Не преднамеренно нарушая инструменты (маршрут, который я бы предпочел избежать, но я серьезно рассматриваю в данных обстоятельствах), мне интересно, действительно ли кто-то здесь занимался подобными ситуациями раньше? Любое понимание того, как подойти к этому, будет с благодарностью.

Обновление: Спасибо за ответы - много хороших идей вокруг.

Если кому-то интересно, я двигаюсь в направлении "уточнения, обучения и управления интерпретацией". Я начал перестраивать свои инструменты, чтобы попытаться лучше отрицать или отслеживать ошибки и автоматически генерировать любые числа и графики, которые они могут захотеть, включая всю документацию (в то время как прячутся как неясные ссылки на необработанные данные, которые они в настоящее время кажутся настолько желающими импортировать в "магические" листы excel).

В частности, я надеюсь, что визуальные представления об ошибках и правильно созданные рейтинговые системы (с учетом ошибок, стандартных отклонений и т.д.) помогут ситуации.

Ответ 1

Либо модифицируйте вывод, чтобы включить информацию об ошибке (поэтому, если ошибка равна +/- 5%, не выводить 22%, выход 17% - 27%), или воспитывать тех, кого это используется против ошибки чтобы они могли защитить себя, когда они используются против них.

Ответ 2

Ну, похоже, вы столкнулись с Законом о непредвиденных последствиях в контекст поведения человека.

К сожалению, как только кошка вышла из сумки, ее довольно сложно вернуть. У вас есть несколько вариантов (которые, между прочим, не являются взаимоисключающими), в том числе:

Измените отчеты, чтобы их данные больше не подвергались насилию в том, как вы описываете.
Работайте с руководством, чтобы помочь им понять, почему их использование ваших данных является неправильным или вводящим в заблуждение.
Работайте с теми, чья производительность измеряется для управления давлением, чтобы пересмотреть свою политику по этому вопросу.
Работайте с менеджерами/аналитиками, чтобы разработать жизнеспособное средство для измерения производительности таким образом, чтобы это было справедливо для всех.
Разбейте отчет таким образом, чтобы сделать его непригодным для использования в любых целях.

Очевидно, есть желание со стороны руководства получить аналитику по эффективности аналитиков. Вероятно, для этого существует настоящая необходимость... и ваши отчеты заполнили пустоту в доступной Информация. Лучшим вариантом для всех было бы найти способ эффективно и достаточно заполнить эту потребность. Существует много возможных способов достижения этого - от снижения плотного рейтинга в пользу уровней производительности до использования временной разницы для уточнения показателей производительности.

Теперь вполне возможно, что существующие отчеты, которые вы предоставили, просто не могут применяться справедливым и точным образом для решения этой проблемы. В этом случае вы должны работать с вашей командой управления, чтобы убедиться, что они понимают, почему это так, - и либо переопределить способ измерения производительности, либо потратить время на разработку соответствующей и справедливой методологии.

Один из самых сильных способов убедить руководство в том, что их (ab) использование данных в вашем отчете неразумно - напомнить им о концепции порочные стимулы.. Возможно, что со временем аналитики изменят свое поведение таким образом, что приведет к более высокому ранжированию в отчетах об эффективности за счет реальной производительности или качества результатов, которые иначе не будут отображены или выражено. Вы, кажется, хорошо понимаете свой домен, поэтому я надеюсь, что вы сможете предоставить конкретные и драматические примеры таких последствий, чтобы помочь вам в вашем случае.

Ответ 3

Все, что вы можете сделать, это попытаться рассказать менеджерам о том, почему то, что они делают, неверно.

Кроме того, вы не можете остановить идиотов от идиотства, и вы просто сойдете с ума, пытаясь.

Я определенно не "сломал" код, на который люди полагаются, даже если это не конкретный результат. Это заставит их жаловаться на вас, что может повлиять на ваш собственный EPR: -)

Ответ 4

Я действительно думаю, что ключом здесь является хорошее общение с вашими менеджерами.

Кроме того, мне нравится идея Патрика. Вы также можете попробовать другие способы разработки своего инструмента вокруг проблемы, чтобы это казалось глупым/трудно использовать в качестве измерения производительности. Измените название статистики, чтобы означать нечто иное, чем "как хороший программист X", затруднить получение данных на человека, показать статистику ошибок.

Вы также можете попытаться отобразить данные по-другому (это может заставить менеджеров думать, что вы пытаетесь им помочь). Покажите график - разница в позиции в несколько пикселей может быть сложнее идентифицировать, чем числовые результаты (моя догадка - ваши менеджеры используют excel и раскрашивают все ниже среднего). Нарисуйте маркер ошибки, поэтому не имеет смысла одерживать лишние проценты. Дайте результат как шкалу - низкую и высокую маржу, учитывающие вашу информацию об ошибках, ее сложнее сравнивать.

Изменить: О да, и читайте о "социальных интерфейсах". Вы можете начать с Spolsky Не просто юзабилити и Построение сообществ с помощью программного обеспечения.

Ответ 5

Я бы сделал эхо @paxdiablo совет, как первый шаг:

Работа над отчетом о присущих ошибках. Фактически, сделайте это введение в каждую созданную копию.
Когда вы ссылаетесь на ошибки измерения, укажите, что они являются нижним пределом ошибок (если на самом деле их нет).
Попытайтесь обучить менеджера (ов) ошибкой его/ее способов.
Если возможно, обсудите проблему с вашим менеджером. И, возможно, с руководством управляющих, в зависимости от того, насколько вы знакомы с ними, вы, вероятно, ограничиваете его просто "выражаете некоторые проблемы" и даете хедз-ап.
Проконсультируйтесь с вашим отделом кадров или кем вы отвечаете за справедливость в обзорах производительности.

Удачи.

Ответ 6

Проблема в том, что код не принадлежит вам, он принадлежит вашей компании. Они действительно могут делать с ними все, что захотят.

Я не хочу этого говорить, но если у вас есть проблема с этикой вашей компании, вам придется покинуть эту компанию.

Ответ 7

Одна вещь, которую вы могли бы сделать, - это реализовать сравнение самостоятельно. Если он действительно хочет проверить, что кто-то выполняет значительно меньше, чем остальные, он также должен быть протестирован формально.

Теперь выбрать правильный тест немного сложно, не зная данных и структуры, поэтому я не могу вам советовать об этом. Просто учтите, что если вы делаете парные сравнения или сравниваете множественные баллы со средним значением, вы сталкиваетесь с проблемой multitesting. Классический способ исправления - использовать Bonferroni. Если вы его реализуете, вы можете быть уверены, что в какой-то момент никто больше не выпрыгнет. Коррекция Бонферрони очень консервативна. Другой вариант - использовать Dunn-Sidak, который должен быть менее консервативным.

Правильной реализацией будет ANOVA - если предположения будут соблюдены и данные, подходящие не по курсу, - с последующим сравнением, например, Tukey Honest Significant Difference test. Таким образом, учитывается, по меньшей мере, неопределенность результатов.

Если у вас нет подсказки о том, какой тест использовать, подробно описывайте свои данные на stats.stackexchange.com и обратитесь за помощью к какой тест использовать.

Приветствия

Ответ 8

Я просто хотел подробно рассказать о ответе "Порочных стимулов" Л.Бушкина. Я легко вижу, что ваша проблема распространяется на то, где аналитики избегают трудных тем, опасаясь уменьшить свой балл. Или, может быть, они предоставят тот же ответ, что и предыдущие этапы, чтобы не повредить оценку друзей, даже если это неверно. Интересный вопрос заключается в том, что произойдет, если более поздний ответ неверен - у вас нет правды, просто последовательных аналитических мнений - в этом случае я предполагаю, что первый ответ отмечен как "неправильный", верно?

Возможно, предоставление некоторых из этих расширений менеджеру поможет.

Ответ 9

Джорис Мейс прав. Вам нужно посмотреть статистические значения.

Но ANOVA - это излишество. Вам нужно посмотреть стандартное отклонение. В частности, при управлении (управлении качеством) отклонение от шести стандартного стандартного отклонения (скудное шесть сигм) является значительным.

По моему личному мнению, если он превышает 3 раза stddev, то у вас определенно (около 100% вероятности) есть проблема, и если он превышает 6 раз stddev, тогда у вас есть проблема, которую нужно срочно обрабатывать (около 400 % вероятности - я знаю, знаю, 100% максимум).

Вы все еще можете быть немного более мягким или нет, применяя формулу математической или случайной выборки для stddev.