Валидность в дословном переводе с английского языка означает «устойчивый, пригодный, соответствующий». В научных кругах данный термин используется, как показатель, который оценивает пригодность той или иной методики исследования в конкретной ситуации, условиях.
Нередко валидность ставят на одну ступень вместе с таким понятием как «надежность». Данный критерий определяет уместность и эффективность, надежность выбранных методов исследования: что и как они измеряют и характеризуют, какую картину отражают, для чего производится оценка.
Чем ближе исследователь подбирается к главному признаку проблемы, который позволяет оценить ее характер и влияние с помощью определенной методики, тем выше ее валидность. Сам процесс проверки действенности (качества) и эффективности, применимости методов исследования называется валидизацией.
Виды валидности методов исследования
Выбор методов научного исследования зависит от ряда фактов: области наук (гуманитарные или прикладные), необходимость проведения анализа с расчетной частью или простое сопоставление фактов, наличие конкретных данных для анализа и пр.
Следует отметить, что в одном исследовании выбранный метод может быть валидным, а в ином – вовсе неэффективен. Поэтому валидность выбранной методики следует оценивать в рамках конкретной научной работы, а не в сравнении с иными исследованиями.
В науке выделяют несколько разновидностей валидности методов исследования:
Виды валидности
- Теоретическая валидность.
Данный вид определяется сопоставлением показателей, рассчитанных с помощью выбранной методики, с аналогичными показателями, рассчитанными по другому методу.
Важно, чтобы рассчитанные параметры были теоретически зависимы, то есть оценивали один и тот же предмет, учитывали одни и те же факторы или схожие факторы влияния, демонстрировали теоретическую зависимость (то есть имели принадлежность к конкретному объекту или суждению).
Этот показатель определяют с помощью корреляции одно и того же показателя или свойства, рассчитываемого с помощью разных методов исследования. При этом важно соблюдение: обе методики должны быть связаны с одной и той же гипотезой или теорией.
Данный критерий рассчитывается или проявляется благодаря действию опытно-логического метода исследования. В частности, он находит отражение на реакции, мышлении, эмоциях, поведении испытуемых объектов. Данный способ применим больше в психологической отрасли, когда требуется оценить реакцию или психологическое состояние человека в конкретной ситуации.
Эмпирическая валидность методов исследования будет выше тогда, когда выбранная методика продемонстрирует тот факт, что полученные данные соответствуют реальным данным испытуемого, то есть во время проведения «чистого» или «естественного» эксперимента: когда поведение объекта в рамках исследования будет полностью совпадать с поведением в реальной жизни.
Данный критерий имеет сходства с эмпирической валидность. Его особенностью является то, что здесь важно установить связь между конкретными параметрами выбранного метода исследования с внешними проявлениями испытуемого (поведением) в реальной жизни.
Этот показатель проявляется в том, что выбранная методика позволяет достичь поставленной цели исследования, доказывает или опровергает эффективность выдвинутой гипотезы.
Фактически, внутренняя валидность демонстрирует соответствие методики исследования его содержанию.
Валидность выбранного метода выше тогда, когда он показывает, что все коэффициенты и действия измеряют именно то, что требуется, связывая эти проявления с внешними признаками проблемы (ее симптомами).
Как оценить валидность методов исследования?
Ученые выделяют следующие критерии эффективности и применимости (то есть валидности) выбранной методики исследования:
Методика исследования
Этот параметр зависит от конкретных результативных показателей. Например, объем выполненных заданий, успеваемость, время (на протяжении которого выполнялось упражнение или задание), полученные навыки и пр.
Эти элементы связаны с отношением испытуемого к конкретным обстоятельствам, положениям и заданиям. Это можно оценить в ходе интервью, опросов, тестирований и др.
- Физиологические критерии.
Они оценивают факторы воздействия на объект исследования, то есть, то что могло оказать влияние при решении вопроса: обстановка и комфорт (свет или шум и пр.), сложность задания, наличие знаний и умений для выполнения задания и пр.
Эти параметры применимы в психологических исследованиях. Например, когда требуется подобрать объект исследования или испытуемое лицо, которое чаще или реже подвергалось различным ЧП.
Для оценки методик используют различные параметры. Они зависят от типа исследования в зависимости от области наук (экономическое, техническое, психологическое, юридическое и пр.).
- Среди наиболее распространенных критериев валидности также выделяют:
- – поведенческие: эмоции, поведение, реакция в определенных условиях или ситуации;
- – успехи в различных видах деятельности: на работе, учебе, творческом поприще, в социуме (авторитет) и пр.;
- – самостоятельность и самоорганизация: умение организовывать и проводить различные действия (взятие проб, проведение эксперимента, разработка заданий и пр.);
- – подбор методики в зависимости от ситуации или адаптация исследователя: анализ полученных данных и координация действий в зависимости от ситуации.
Следует отметить, что рассмотреть валидность только что разработанной методики очень сложно, а на практике практически невозможно. Доказательство ее валидности фактически приводится в рекомендательной части научной работы, когда исследователь доказывает эффективность предложенных мер, проводит апробацию результатов исследования.
Источник: https://disshelp.ru/blog/chto-my-ponimaem-pod-validnostyu-metoda-issledovaniya/
Библиотека постов
t-критерий Стьюдента – общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Уильям Госсет
1. История разработки t-критерия
Данный критерий был разработан Уильямом Сили Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется t-критерий Стьюдента?
t-критерий Стьюдента используется для определения статистической значимости различий средних величин.
Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата). В последнем случае рассчитывается парный t-критерий Стьюдента
3. В каких случаях можно использовать t-критерий Стьюдента?
Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch's t).
При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.
4. Как рассчитать t-критерий Стьюдента?
Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:
где М1 — средняя арифметическая первой сравниваемой совокупности (группы), М2 — средняя арифметическая второй сравниваемой совокупности (группы), m1 — средняя ошибка первой средней арифметической, m2 — средняя ошибка второй средней арифметической.
5. Как интерпретировать значение t-критерия Стьюдента?
Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:
f = (n1 + n2) — 2
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).
Сравниваем критическое и рассчитанное значения критерия:
- Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
- Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.
6. Пример расчета t-критерия Стьюдента
Для изучения эффективности нового препарата железа были выбраны две группы пациентов с анемией. В первой группе пациенты в течение двух недель получали новый препарат, а во второй группе — получали плацебо. После этого было проведено измерение уровня гемоглобина в периферической крови.
В первой группе средний уровень гемоглобина составил 115,4±1,2 г/л, а во второй — 103,7±2,3 г/л (данные представлены в формате M±m), сравниваемые совокупности имеют нормальное распределение. При этом численность первой группы составила 34, а второй — 40 пациентов.
Необходимо сделать вывод о статистической значимости полученных различий и эффективности нового препарата железа.
Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:
После выполнения расчетов, значение t-критерия оказалось равным 4,51. Находим число степеней свободы как (34 + 40) — 2 = 72.
Сравниваем полученное значение t-критерия Стьюдента 4,51 с критическим при р=0,05 значением, указанным в таблице: 1,993.
Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р
Источник: https://medstatistic.ru/theory.html
Валидность эксперимента — это… что такое валидность эксперимента?
- валидность эксперимента — (от англ. validity полноценность) достоверность (и степень достоверности) вывода, к рую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. Понятие «В». объединяет основные цели исследования с… … Большая психологическая энциклопедия
- валидность эксперимента — критерий качества эксперимента, степень его точности, в зависимости от которой выводы, полученные в его ходе могут быть распространены на всю генеральную совокупность. В.э. позволяет определить насколько всеобщими могут быть выводы, полученные… … Энциклопедический словарь по психологии и педагогике
- ВАЛИДНОСТЬ ЭКСПЕРИМЕНТА — качество эксперимента, гарантирующее обоснованность выводов: 1) о том, что именно экспериментальный фактор является причиной изменений, зарегистрированных в зависимой переменной (внутренняя валидность); 2) о том, что выявленная зависимость… … Российская социологическая энциклопедия
- Валидность эксперимента — (отангл. validity полноценность) 1) оценка проведенного эмпирического исследования с точки зрения правильности его организации и тем самым возможности считать полученные результаты и сделанные выводы достоверными. Валидность при использовании… … Словарь-справочник по педагогической психологии
- Валидность эксперимента — (отангл. validity полноценность) 1) оценка проведенного эмпирического исследования с точки зрения правильности его организации и тем самым возможности считать полученные результаты и сделанные выводы достоверными. Валидность при использовании… … Словарь по педагогической психологии
- Валидность эксперимента — достоверность (и степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. Понятие «валидность» объединяет основные дели исследования с идеальными эталонами их… … Исследовательская деятельность. Словарь
- ВАЛИДНОСТЬ ЭКСПЕРИМЕНТА — достоверность (и степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. Понятие «валидность» объединяет основные цели исследования с идеальными эталонами их… … Профессиональное образование. Словарь
- валидность эксперимента внутренняя — критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной… … Энциклопедический словарь по психологии и педагогике
- валидность эксперимента внешняя — критерий качества эксперимента, в зависимости от которого выводы об определенной тенденции, закономерности развития конкретных психических явлений, личностей, видов деятельности и т.д. могут быть распространены на другие явления и т.д. в данной… … Энциклопедический словарь по психологии и педагогике
- Внутренняя валидность эксперимента — критерий оценки планирования и проведения исследования, позволяющий считать достоверными выводы относительно именно представленной в гипотезе зависимости (а не какой то другой) … Словарь-справочник по педагогической психологии
Источник: https://dic.academic.ru/dic.nsf/business/16928
Социально-психологический центр, 1996. – 391 с
По Кэмбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. – Спб.
Социально-психологический центр, 1996. – 391 с.
В основе разделения планов на доэкспериментальные, квазиэкспериментальные и истинныележит критерий истинности эксперименту (валидности эксперимента). Чем меньше артефактов (угроз валидности) провоцируют тот или другой план, чем строже экспериментальный контроль тем ближе эксперимент к идеальному.
Характерные признаки планов
ДОЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ | ПЛАНЫ ИСТИННЫХ ЭКСПЕРИМЕНТОВ | КВАЗИЭКСПЕРИМЕНТАЛЬНЫЕ ПЛАНЫ |
◊ неэквивалентность исследуемых групп при наличии контрольной группы или отсутствие контрольной группы; ◊ отсутствие или низкие возможности контроля угроз валидности; ◊ наличие значительного количества угроз внутренней валидности и отсутствие возможности контроля внешней; ◊ невозможность вывода об однозначной каузальной связи. | ◊ наличие стратегии формирования эквивалентных экспериментальных групп, в частности рандомизации; ◊ наличие двух или больше экспериментальных групп; ◊ возможность вывода об однозначной каузальной связи; ◊ широкие возможности контроля переменных; ◊ завершение эксперимента измерением и сравнением его результатов в разных группах. | ◊ проведение в природных условиях, когда затруднен контроль; ◊ наличие контрольной группы или серии измерений экспериментального эффекта; ◊ возможность сравнения результатов экспериментальных групп или результатов одной группы до и после воздействия; ◊ ограниченные возможности управления переменными. |
Типы квазиэкспериментальных планов
ПЛАНЫ ДЛЯ ЭКСПЕРИМЕНТАЛЬНЫХ ГРУПП | ПЛАНЫ ДЛЯ НЕЭКВИВАЛЕНТНЫХ ГРУПП | ПЛАНЫ С ВРЕМЕННЫМИ СЕРИЯМИ | ПЛАНЫ EX-POST-FACTO |
Экспериментальные группы эквивалентны между собой. Планы отличаются от истинных тем, что предварительные и итоговые измерения выполняются в разных группах | Экспериментальные группы неэквивалентны между собой. Контроль обеспечивается предварительным и итоговым измерением в каждой группе. | Планы с одной или несколькими неэквивалентными группами и в которых выполняется повторяющиеся со временем измерения до и после влияния или серии влияние-измерение. | Планы, в которых варианты проявления НП не контролируются экспериментатором, а являются фактом, который возник без воли исследователя. В таких планах эквивалентность групп условная. |
Доэкспериментальные планы
ПЛАН | ПРИМЕР |
ХО Исследованиечастного случая (результаты эксперимента сопоставляются с житейскими представлениями о реальности; в плане отсутствует возможность сравнения с научными достоверными данными; отсутствует возможность контроля независимой переменной) | Пример из Корниловой ТВ. Экспериментальная психология. Теория и методы: учебник для вузов. – М.:Аспект Пресс, 2002. – 381 с. Цель эксперимента: изучается эффективность нового метода преподавания психологии в вузе. Независимая переменная: введение нового метода преподавания. Зависимая переменная: успешность студентов в обучении. Организация эксперимента: в одной из академических групп первого курса используется новый метод преподавания психологии. Вывод об эффективности метода делается на основании анализа результатов экзамена – средний балл в группе – 4.2. Артефакты (угрозы валидности): фон (влияние личности преподавателя); природное развитие (интеллектуальное развитие студентов); состав групп (выходной высокий уровень студентов); отсеивание («слабые» студенты отказались от занятий); взаимодействие состава групп с экспериментом (студенты экспериментальной группы – выпускники специализированного лицея). |
ОХО Планспредварительным иитоговымизмерениемводнойгруппе (сопоставляются результаты до и после экспериментального влияния на одну группу; в плане отсутствует контрольная группа, это не позволяет сделать однозначный вывод о том, что изменение между О1 и О2 вызваны именно Х) | Пример из Мартин Д. Психологические эксперименты. – Спб.: ЕВРОЗНАК, 2002. – 480 с. Цель эксперимента: изучается влияние телепрограмм посвященной Холокосту на информированность населения об этом событии. Независимая переменная: показ телепрограммы. Зависимая переменная: информированность населения. Организация эксперимента: на одном из центральных каналов транслируется передача, в которой рассказывается о массовом уничтожении евреев (Холокост). После группе личностей рассылается опросник о событиях Холокоста. Вывод о влиянии телепередачи делается на основе анализа результатов опросника – 76 % опрошенных знают о событиях Холокоста. Угрозы валидности: фон (участники были проинформированы раньше или повлияло другое событие); природное развитие (участники школьники); эффект тестирования (на информированность повлиял опрос, а не просмотр передачи); инструментальная ошибка (недоскональный опросник); взаимодействие тестирования с Х (участники знают о событии именно в результате опросника); взаимодействие состава групп с Х(опросили только лиц с высшим образованием). |
ХО О Плансравнениястатистических групп (результаты эксперимента сопоставляются с результатами неэквивалентной контрольной группы; в плане отсутствует предварительное измерение, что не дает однозначного вывода о том, что отличие в результатах сравниваемых групп вызвано именно Х). | Пример из Кэмбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. – Спб. Социально-психологический центр, 1996. – 391 с. Цель исследования: сравнивается успешность обучения школьников, которые прошли курс быстрого чтения и тех, кто не проходил. Независимая переменная: прохождение курса быстрого чтения. Зависимая переменная: успешность школьников в обучении. Организация эксперимента: в одном из классов школы все ученики прошли курс быстрого чтения, тогда как ученики другого класса такого курса не проходили. Вывод об эффективности прохождения курса делается на основании сопоставления результатов обеих групп – ученики первой группы получили средний балл успешности за четверть – 4; второй – 3.4. Угрозы валидности: состав групп (выходной высокий уровень школьников, которые проходили курс); отсеивание («слабые» ученики были переведены в класс, который не проходил курс); взаимодействие состава группы с экспериментом (ученикам экспериментальной группы было обещано вознаграждение за прохождения курса). |
Планы истинных экспериментов
ПЛАН | ПРИМЕР |
R X O R O План с контрольной группой и измерением после влияния. (сопоставляются результаты эквивалентных групп экспериментальной и контрольной групп после влияния. Рандомизация и отсутствие предварительного измерения позволяют контролировать угрозы внешней валидности). | Пример из Кэмбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. – Спб. Социально-психологический центр, 1996. – 391 с. Цель исследования: сравнивается успешность обучения школьников, которые прошли курс быстрого чтения и тех, кто не проходил. Независимая переменная: прохождение курса быстрого чтения. Зависимая переменная: успешность школьников в обучении. Организация эксперимента: в одном из классов школы все ученики прошли курс быстрого чтения, тогда как ученики другого класса такого курса не проходили. Вывод об эффективности прохождения курса делается на основании сопоставления результатов обеих групп – ученики первой группы получили средний балл успешности за четверть – 4; второй – 3.4. Угрозы валидности: взаимодействие состава группы с экспериментом (ученикам экспериментальной группы было обещано вознаграждение за прохождения курса). |
R O X O R O O План для двух рандомизированных групп с предварительным и итоговым измерением. (сопоставляются результаты эквивалентных экспериментальной и контрольной группы до и после влияния. Рандомизация и измерение до и после влияния являются эффективными приемами контроля угроз валидности). | Из материалов исследований студентов социально- психологического факультета Житомирского университета имени Ивана Франка (2004-2005 г). Цель эксперимента: исследовать влияние метода двойного оценивания (каждая оценка удваивается, вместо «5» ставится «5», «5») на успешность учеников. Независимая переменная: метод двойного оценивания. Зависимая переменная: общая успешность учеников за год. Организация эксперимента: в эксперименте принимают участие ученики одного из классов общеобразовательной школы. Дети случайным образом поделены на две подгруппы с изучением английского языка (уроки проводит одна и та же учительница). Сделан предварительное измерение успешности детей. Потом в одной из групп задействован метод двойного исследования (эксперимент длился на протяжении месяца). По завершению эксперимента снова применялось измерение в обеих группах. Установлено, что участники группы, в которой применился метод двойного оценивания, показали выше учебную успешность, чем участники контрольной группы. При измерении успешности учитывалась лишь одна из «двойных» оценок. |
R O X O R O O R X O R O План Соломона (сопоставляются результаты 4-х эквивалентных групп (объединение первых двух планов); использование рандомизации, измерений до и после влияния, а так же групп, в которых измерение до влияния отсутствует, позволяет проконтролировать все угрозы валидности). | Из материалов исследований студентов социально- психологического факультета Житомирского университета имени Ивана Франка (2004-2005 г). Цель эксперимента: изучить влияние вербального поощрения на продуктивность изобразительной деятельности детей дошкольного возраста. Независимая переменная: вербальное поощрение. Зависимая переменная: продуктивность изобразительной деятельности. Организация эксперимента: в эксперименте приняли участие дети, которые обучаются в подготовительных группах одного из городских садиков. Для работы с экспериментатором детей было поделено случайным образом на 4 группы по 10-12 детей в каждой группе (А, Б, В, Г). Предварительно были проанализированы рисунки (сделанные на протяжении предыдущей недели) участников 2-х групп (А, Б). После этого экспериментатор работал отдельно с детьми каждой группы. Детям было предложено рисовать на вольную тему, при этом детей групп А и В постоянно поощряли, отмечали стиль рисования и общую старательность, тогда как дети других двух групп не поощрялись. Гипотеза подтвердилась: вербальное поощрение повышает продуктивность изобразительной деятельности детей. |
Рекомендуемые страницы:
Источник: https://poisk-ru.ru/s24138t4.html
5.1. Компоненты эксперимента — Как написать выпускную квалификационную работу
Эксперимент — это система приемов и методов изучения явлений посредством изменения условий их протекания. Эксперимент всегда связан с практической деятельностью, он имеет внедренческий характер и представляет собой комплекс методов и средств изучения явлений.
Состав эксперимента: 1) объект и предмет исследования как зависимые переменные; 2) методы и средства преобразования предмета в объекте как независимые переменные; 3) технология использования независимых переменных; 4) диагностика и методы диагностики результатов влияния независимых переменных на зависимые переменные.
Объект и предмет экспериментирования в дипломной работе — это то, что предполагается усовершенствовать. Изменение зависимых переменных и становится целью эксперимента.
Содержательно, но не по формулировке, цели и предмет эксперимента полностью совпадают. Для установления особенностей или закономерностей изменений изучаемых качеств (предмета экспериментирования) достаточно сделать выборку.
Выборка должна быть репрезентативной.
Репрезентативность — это свойство выбранного количества опытов проявлять те же свойства и особенности, которые присущи всей совокупности таких же опытов. На уровне учебно-исследовательской работы определять репрезентативность очень сложно, чаще всего это делают условно или приблизительно, а еще чаще — по аналогу с уже проводимыми подобными экспериментами.
Методы и средства преобразования объекта и предмета экспериментирования, их развития и совершенствования называются независимыми переменными. Они должны быть независимы от тех качеств и свойств, которые исследуются в эксперименте. Независимая переменная не придумывается, а выводится из гипотезы исследования, так как весь эксперимент и служит ее практическому доказательству.
Именно и гипотезе указывается, какие пути и способы выбрал студент для достижения цели. Независимы переменные и могут быть тем новым (новацией или инновацией), что вносит студент, выполняющий дипломную работу, в теорию и практику.
Технология использования независимых переменных — это порядок проведения эксперимента, режим его введения в деятельность, определение дополнительных условий введения.
Диагностико-аналитические методы в эксперименте связаны с параметризацией эксперимента, то есть с выделением показателей эффективности влияния независимых переменных на зависимые переменные и с возможностью их измерить. Методы, избранные для диагностики зависимых переменных, должны быть валидными.
Валидность методов — это их способность измерять именно данную зависимую переменную и ее изменения, то есть соответствие метода и параметрических характеристик объекта предмету экспериментирования, их адекватность.
Алгоритм экспериментирования примерно таков. Перед началом эксперимента студент-экспериментатор замеряет с помощью диагностических методов состояние зависимых переменных, затем вводит независимые переменные, под влиянием которых происходят изменения состояния зависимых переменных.
Эти изменения опять замеряются и затем сопоставляются с начальными данными. Зависимые и независимые переменные в практической деятельности приходят во взаимодействие. Качество взаимодействия зависит от технологии использования (ввода) независимых переменных.
Результат взаимодействия зависимых и независимых переменных оценивается с помощью специальных аналитических методов.
Источник: https://www.sites.google.com/site/thisdiplomaworks/exp/exp1
Валидность психологического эксперимента (стр. 1 из 6)
- План работы
- 1 Планирование как средство повышения валидности эксперимента
- 1.1 Валидность и использование мысленных образцов эксперимента
- 1.2 Виды валидности при оценке психологического эксперимента
- 1.3 Конструктная валидность и концептуальные репликации
- 1.4 Специфика оценки валидности лабораторного эксперимента
- 1.5 Валидность эксперимента и валидность выводов
- 2 Компоненты содержательного и формального планирования
2.
1 Подходы к определению термина «планирование эксперимента». Выбор из возможных экспериментальных планов
- 2.2 Содержательное планирование и выбор типа эксперимента
- 2.3 Зависимость обобщения от типа проводимого эксперимента
- 2.4 Статистические решения и формальное планирование
- 2.5 Валидность как цель экспериментального контроля
- Список использованных источников
1 Планирование как средство повышения валидности эксперимента
1.1 Валидность и использование мысленных образцов эксперимента
Оценка валидности реально проводимых экспериментов совершается путем использования неких «внутренних очков», сквозь призмы которых удается увидеть направления возможных или уже сделанных ошибок при планировании и проведении эксперимента. Р. Готтсданкер использовал удобный прием представления в качестве таких направлений мысленных образцов эксперимента.
Не следует путать понятия «мысленный эксперимент» (МЭ) и «мысленный образец» эксперимента. МЭ может быть понят, во-первых, как принятый норматив размышлений психолога на всех этапах следования логике экспериментальной проверки психологической гипотезы.
Во-вторых, МЭ может рассматриваться в контексте использования психологом мысленных образцов с целью оценивания контроля угроз выводу об эмпирической зависимости.
В-третьих, МЭ может представлять такой эксперимент, который нереализуем из-за отсутствия средств операционализации переменных, принятия определенных этических нормативов или экономических соображений и т.д.
В первых двух случаях путь мысленного экспериментирования – это обсуждение экспериментальной модели, задающей интересующую исследователя связь между переменными, когда анализируется реально проведенный или планируемый для реального сбора данных эксперимент.
В третьем случае МЭ может представлять схему заведомо ирреального, т.е. в принципе нереализуемого исследования. В нем, однако, представлен путь возможной организации выводов, если бы исследователю были доступны предполагаемые формы экспериментального контроля.
Как и реально проводимый эксперимент, мысленный эксперимент является средством проверки не любых психологических гипотез. Детерминистски сформулированные гипотезы, проверяемые в МЭ, могут быть каузальными и структурно-функциональными.
Последние не являются предметом экспериментирования в узком смысле этого термина, но могут направлять построение, например, формирующих экспериментов.
Методы теоретического моделирования, более отвечающие проверке структурно-функциональных гипотез, не рассматриваются в данном учебнике, построенном как введение в эксперимент в качестве метода сбора эмпирических данных.
При планировании психологического эксперимента МЭ может быть понят и как осуществляемый во внутреннем, умственном плане ход экспериментальной деятельности, внешне реально развернутой в этапах проведения эксперимента. Собственно, все этапы планирования – это варианты мысленного экспериментирования с целью определения наилучших форм экспериментального контроля, выбора лучшего из возможных экспериментальных планов.
Наряду с планированием в функции мысленного эксперимента входит обоснование или оценка валидности реально проводимых экспериментов. Мысленные образцы, по отношению к которым оцениваются свойства реально проводимого эксперимента, позволяют обсуждать основные аспекты «правильности» построения экспериментальной модели.
Правильность означает в данном случае лишь степень приближения к наилучшему мысленному воплощению экспериментальных условий, соответствующих конкретной экспериментальной гипотезе. Экспериментатор может правильно или неправильно выбрать и обосновать переменные, методики как средства операционализации этих переменных.
Экспериментатор может ввести смешения НП с другими переменными или удачно избежать смешений.
Он может получить более или менее надежные данные, установив то или иное количество проб на каждое из условий НП; может обеспечить случайность разброса условий побочных переменных по уровням НП или не проконтролировать несистематическую изменчивость (НП, ЗП, побочных факторов).
Именно такое прочтение функций мысленных образцов представлено в использованных Р. Готтсданкером понятиях идеального и бесконечного экспериментов, экспериментов полного соответствия и безупречного. Все эти четыре термина служат для уточнения критериев, в соответствии с которыми необходимо оценивать успешность планирования, организации и проведения эксперимента, осуществляемого реально.
В контексте рассматриваемых нормативов профессиональных рассуждений психолога термин «мысленный эксперимент» – один из таких нормативов (или «внутренних очков»), используя которые психолог может ответить на многие вопросы относительно достигнутого уровня эмпирической подкрепленности проверяемой каузальной гипотезы.
Однако нет рецепта, как пользоваться этими «очками» в каждом конкретном случае. Иногда от них нужно отказаться, если тип исследования не таков, чтобы применять к нему сложившиеся нормативы экспериментальной оценки гипотезы.
Однако такой отказ не следует путать с неумением правильно организовать и проводить психологический эксперимент.
1.2 Виды валидности при оценке психологического эксперимента
Виды валидности – это направления сравнений реально проводимых экспериментов с мысленными образцами.
Оценка валидности связана как с оценкой реализации выбранных форм экспериментального контроля, так и с оценкой системы умозаключений при организации исследования с точки зрения следования нормативам экспериментального вывода.
Нормативы, связанные с возможными обобщениями из психологических экспериментов, предполагают разведение разных видов валидности.
Внутренняя и внешняя валидность – обязательно обсуждаемые аспекты правильного эксперимента, будь то эксперимент в научных или практических целях. Отличия в выводах из этих экспериментов будут касаться того, как строится обобщение: переносится ли оно на других людей, другие ситуации, виды деятельности или на теоретическую модель.
Внутренняя валидность эксперимента обеспечивает вывод только об исследуемой зависимости, т.е. об отношении между независимой и зависимой переменными, но ничего не сообщает о возможности ее распространения за пределы данной экспериментальной ситуации.
Если полученные данные характеризуются ненадежностью или наличием смешений (систематических, несистематических, сопутствующих), то нельзя считать обоснованным утверждение, формулируемое в экспериментальной гипотезе, даже если получен соответствующий ей экспериментальный эффект.
Если внутренняя валидность проведенного эксперимента оценивается высоко, то из этого также еще не следует, что установленная экспериментально зависимость соответствует чему-либо в реальности.
Так, в лабораторных экспериментах экспериментальная модель может представлять модель научную, репрезентирующую определенные связи между операционализированными переменными.
Возможны случаи, когда для этих моделей потом не находятся те виды субъективной реальности, которые они были призваны репрезентировать в экспериментальной ситуации. Тем самым не находится той эмпирии, на которую можно было бы перенести обобщение установленной в эксперименте зависимости.
Внешняя солидность, предполагающая решение проблем соответствия (НП, ЗП, ДП), обеспечивает возможность обобщения на те виды ситуаций или виды деятельности, которым соответствуют экспериментально контролируемые переменные.
Если речь идет о теоретических обобщениях, то оценка внешней валидности уступает место оценке конструктной валидности.
Решение вопросов о конструктной и внешней валидности приводит исследователя к выбору типа эксперимента: естественного («дублирующего реальный мир»), искусственного (улучшающего реальный мир) или лабораторного.
Необходимо различать системы теоретических положений, предполагающих, что они имеют отношение к миру реальности (для психологических теорий это мир субъективной, или психологической, реальности), и положений, не нацеленных на соотнесение мира теории и эмпирии (как онтологической реальности, если пользоваться терминологией П. Фресса и Ж. Пиаже).
Это различение может касаться авторской позиции: «если моей теории в мире реальности ничего не соответствует, то пусть ей – реальности – будет хуже». Оно может быть следствием того, что сформулированным психологическим конструктам не было найдено соответствия на уровне опытных данных.
При рассмотрении особенностей экспериментального метода речь идет несколько о другом – о возможности эмпирически оценивать теоретические каузальные объяснения.
Экспериментальный метод предполагает построение исследования с целью отвержения неадекватных объяснений или «неверных» теорий как не соответствующих эмпирически установленным зависимостям.
Чаще неразличение продуктивного теоретизирования и псевдотеоретизирования связано с тем, что всегда необходим существенный «прорыв» в обобщении, чтобы соотнести хотя бы посредством гипотетических конструктов закономерности, устанавливаемые при построении экспериментальных ситуаций (экспериментальных моделей) и теоретических моделей.
Только содержательное обсуждение устанавливаемой в каузальной гипотезе связи между переменными, учитывающее объяснительные принципы, сложившиеся в рамках конкретных психологических школ, позволяет исследователю настаивать на реальности, т.е.
«эмпирической загруженности», стоящих за переменными психологических понятий и исследуемых зависимостей. Анализ эмпирической загруженности следующих из теории гипотез выполняет при этом существенную роль «ограничителя» для утверждения псевдозакономерностей.
Источник: https://mirznanii.com/a/197072/validnost-psikhologicheskogo-eksperimenta
Валидность теста
Валидность теста (от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста.
Различают несколько видов валидность теста:
- валидность теста конструктная,
- валидность теста по критерию,
- валидность теста по содержанию,
- прогностическая валидность теста и др.
Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на в. В результате оказывается, что они бесполезны или даже вредны.
Валидность теста – это показатель степени его эффективности. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности.
Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.
Валидность теста конструктная
критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект», его структуры.
Степень соответсвия нашего предварительного понимания и определения интеллекта реальной возможности конкретного теста, степень соответствия структуры интеллеткта структуре теста и есть в.т.к. Она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.
Валидность теста по критерию
критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества личности на практике.
Например, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых на протяжении достаточно продолжительного времени в интересующем нас аспекте. Оценка должна даваться по шкале порядковой, интервальной или отношений. В лучших тестах в. по критерию, измеренная коэффициентом корреляции, составляет от 0,3 до 0,8. Применение теста оправдано, если валидность по критерию оставляет 0,2-0,25.
Валидность теста по содержанию
критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров.
Если, например, нужно проверить с помощью теста математическую подготовку абитуриента вуза, то в предлагаемый тест должны быть включены математические задания, для решения которых необходимы знания по всем разделам математики, изучаемым в средней школе.
Таким образом, степень соответствия структуры данного теста структуре программы математических дисциплин, изучаемых в школе, и является валидностью данного теста по содержанию. Естественно, что для обследования лиц, окончивших вузы, предназначаются тесты с иной вялидностью по содержанию.
Валидность теста прогностическая
критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у различных людей в будущем. Данный вид валидности является особо ценным с практической точки зрения.
Валидность эксперимента
критерий качества эксперимента, степень его точности, в зависимости от которой выводы, полученные в его ходе могут быть распространены на всю генеральную совокупность. В.э. позволяет определить насколько всеобщими могут быть выводы, полученные путем исследования ограниченной по времени и обьему выборки. Различают внутреннюю и внешнюю валидность эксперимента.
Валидность эксперимента внешняя
критерий качества эксперимента, в зависимости от которого выводы об определенной тенденции, закономерности развития конкретных психических явлений, личностей, видов деятельности и т.д. могут быть распространены на другие явления и т.д.
в данной или иной сфере. Языком математики это можно сформулировать так: насколько закономерности данного подмножества характерны для всего множества. Для определения границ применения экспериментальных выводов и необходимо определять в.э.в.
Валидность эксперимента внутренняя
критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной совокупности.
Допустим, исследуя степень влияния освещенности на эффективность производственной деятельности ткачих, психологи обнаружили статистическую зависимость их эффективности работы от частоты смены освещения.
Что является основным фактором повышения эффективности деятельности: смена освещения, внимание экспериментаторов, особое поведение руководителей в период эксперимента или другие факторы? В данном случае психологи пришли к выводу: появление молодых мужчин-исследователй в цехе, где работали женщины, и послужило причиной повышения производительности их труда.
Но ведь могла быть и принята гипотеза о росте производительности ткацкого труда в зависимости от смены освещенности. В.э.в. показывает в какой степени независимая переменная (производительность труда) связана с зависимой (освещенность). Строго научное проведение психологического эксперимента предполагает определение его валидности.
Источник: https://hr-portal.ru/article/validnost-testa
Валидность психологического исследования. Виды валидности. Основные угрозы валидности эксперимента в психологии
⇐ ПредыдущаяСтр 22 из 30Следующая ⇒
Валидность исследования – оценка проведенного эмпирического исследования с точки зрения «правильности» его организации, возможности считать полученные рез-ты и сделанные выводы достоверными. Валидность при использовании методов наблюдения или эксперимента включает оценку репрезентативности исследования как степени его приближения к возможным безупречным мысленным образцам.
Валидность эксперимента – это степень соответствия его предполагаемым мысленным образцам. Различают 5 основных видов валидности: внутренняя, внешняя, операциональная, конструктная, популяционная.
Мысленные образцы эксперимента – это критерии, в отношении к которым обсуждаются разные аспекты валидности реально проводимых исследований.
Оценка психологических гипотез включает знание правил статистического вывода и оценки валидности эксперимента (внутренней и операциональной).
Оценка внутренней и операциональной валидностей позволяет оценить возможность артефактных выводов. Они обеспечивают достоверность вывода о зависимости.
Внутренняя и операциональная оцениваются в любом эксперименте, внешняя – в естественном; конструктная – при проверке теоретических гипотез; популяционная – при оценке репрезентативности выборки с точки зрения возможности переносить обобщения на популяции.
1. Внутренняя валидность – критерий оценки планирования и проведения исследования, позволяющий считать достоверными выводы относительно именно той зависимости, которая сформулирована в ЭГ, как об отношении между НП и ЗП с точки зрения приближения эксперимента к идеальному и бесконечному.
Ее оценка входит в формальное планирование. Анализ эквивалентности групп – внутренняя валидность. Угрозы исходят от систематических и несистематических смешений с ПП. Основной источник угроз в межгрупповых схемах – межиндивидуальные различия. Обеспечивает достоверность вывода о зависимости и позволяет оценить возможность артефактных выводов.
2. Внешняя валидность – критерий оценки исследования с т.зр. решения проблем соответствия сформулированных в ЭГ переменных и реализованных методически условий тем, на которые осуществляется обобщение полученных рез-тов (приближение к эксперименту полного соответствия). соответствие реального исследования изучаемой объективной реальности.
Ее оценка входит в содержательное планирование. Позволяет делать обобщение за пределы ситуации. Аспект репрезентативности испытуемых – внешняя валидность. Обеспечивает надежность как устойчивость и воспроизводимость результатов.
3. Операциональная валидность – оценка эксперимента с т. зр. степени соответствия эмпирически нагруженным понятиям НП, ЗП и ДП тех методик задания и измерения переменных, которые используются в исследовании.
Ее оценка входит содержательное и формальное планирование. В лабораторном эксперименте может совпадать с оценкой конструктной валидности. Надежность методик – аспект операциональной валидности. Оценка операциональной валидности связана с тем, насколько удачно совершен переход от формулирования гипотез к выбору методик.
4. Конструктная валидность – аналог внешней валидности; это оценка соответствия представленных в ЭГ переменных теоретическим конструктам и ТГ.
Ее оценка входит в содержательное планирование. От нее зависит оценка возможности обобщения.
5. Популяционная валидность – это оценка того, насколько правомерно распространять обобщения, полученные на ограниченной выборке, на более широкие выборки и популяции.
Оценка этого вида валидности зависит от качества отбора испытуемых из популяции и от стратегий контроля индивидуальных различий. Ее оценка влияет на возможность обобщение за пределы исследования.
Репрезентативность выборки – основной аспект оценки популяционной валидности. Выборка испытуемых из популяции не может представлять ее безупречно, но высокая репрезентативность м.б.
достигнута при правильных стратегиях отбора испытуемых
Дональд Кэмпбелл описал ряд факторов, которые могут внести погрешность при проведении проведении психологических экспериментов.
При этом под внешней валидностью (надёжностью) он понимал ответ на вопрос: какие иные переменные, кроме экспериментального воздействия Х, могут влиять на результат эксперимента У? «К факторам, ставящим под угрозу внешнюю валидность, или репрезентативность эксперимента, относятся: 9) реактивный эффект, или эффект взаимодействия тестирования, — возможное уменьшение или увеличение сензитивности, или восприимчивости, испытуемых к экспериментальному воздействию под влиянием предварительного тестирования. Результаты лиц, прошедших предварительное тестирование, будут нерепрезентативны по отношению к тем, кто не подвергался предварительному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые; 10) эффекты взаимодействия фактора отбора и экспериментального воздействия; 11) условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент, которая не позволяет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных условиях; 12) взаимная интерференция экспериментальных воздействий, нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как правило, не исчезает. Это относится особенно к планам экспериментов с одной группой».
При этом под внутренней валидностью (надёжностью) он понимал ответ на вопрос: действительно ли экспериментальное воздействие Х привело к результату эксперимента У? «Далее будут представлены восемь различных классов внешних переменных, относящихся к внутренней валидности.
Если эти переменные не контролируются в экспериментальном плане, то они могут дать эффекты, которые смешиваются с эффектом экспериментального воздействия.
Эти переменные представляют влияние: 1) фона (history) — конкретных событий, которые происходят между первым и вторым измерением наряду с экспериментальным воздействием; 2) естественного развития (maturation) — изменений испытуемых, являющихся следствием течения времени per se (не связанных с конкретными событиями), например взросление, усиление голода, усталости и т. п.
; 3) эффекта тестирования (testing) — влияния выполнения заданий, применяемых для измерения, на результаты повторного испытания; 4) инструментальной погрешности, нестабильности измерительного инструмента (instrumentation), при которой изменения в калибровке инструмента или изменения, характеризующие наблюдателя или оценочные показатели, могут вызвать изменения в результатах измерения; 5) статистической регрессии (statistical regression), имеющей место тогда, когда группы отбираются на основе крайних показателей и оценок; 6) отбора испытуемых (selection) — неэквивалентности групп по составу, вызывающей появление систематической ошибки в результатах; 7) отсева в ходе эксперимента (experimental mortality) — неравномерности выбывания испытуемых из сравниваемых групп; 8) взаимодействий фактора отбора с естественным развитием и др., которые в ряде квазиэкспериментальных планов с несколькими группами […] ошибочно принимаются за эффект экспериментальной переменной». ( Дональд Кэмпбелл, Эксперименты и квазиэксперименты / Модели экспериментов в социальной психологии и прикладных исследованиях,) Позже, в других работах Дональд Кэмпбелл дополнил список факторов, способных исказить результаты экспериментов: — сомнение по поводу направления причинной связи; — диффузия или имитация воздействия; — компенсаторное уравнивание воздействия; — компенсаторное соперничество испытуемых; — деморализация испытуемых, вызванная обидой в связи с обделённостью желаемым воздействием; — особенности фона в данной группе, взаимодействие факторов отбора и фона.
⇐ Предыдущая17181920212223242526Следующая ⇒
Рекомендуемые страницы:
Источник: https://lektsia.com/5xc5d.html