کارگاه طراحی ابزار- دانشگاه آزاد علی آباد کتول، گلستان، چهارشنبه 4 اردیبهشت 98
برخی از دست نوشته هایم از کارگاه
دکتر آرمین زارعی: فیس ولیدیتی، کانستراکت ولدیتی: می تواند دایورجنت، مولتی متد، اکسپریمنتال، استراکچال باشد و البته قویترین آن روایی عاملی یا فاکتوریال ولدیتی است گاهی ممکن است نتوانید عاملی انجام دهید از روش های دیگر استفاده می کنید
همسانی درونی را با چه اندازه می گیرید؟ با الفای کرونباخ
measurement sources
گزارش های وربال - برای حوزه علوم پزشکی کاربرد دارد – می تواند خودگزارش دهی باشد – ساختارمند است مصاحبه می تواند ساختارمند باشد چهره به چهره باشد یا تلفنی باشد
گاهی ابزار شما پراکسی ریپورت است گزارش وکالتی است خود گزارشی نیست کس دیگری گزارش می دهد مانند والدین یک کودک یا خانواده بیمار در کما.
مشاهده یک روش دیگری است
چک لیست به ما می گوید وجود یا عدم وجود چیزی، دوجهی است مشکل این نوع ابزارها چیست؟ گرفتاری ما کجاست؟ در ابزارهای دو وجهی خطای بالاتری داریم یک روش قوی سازه مثل تحلیل عاملی را نمی توانم بکار ببریم . اگر قرار است مشاهده کنید می توانید از چک لیست ابزرویشنال ریتینگ استفاده کنید
در ابزار بهترین حالت 5 و 7 و 11 بهترین است، معمولا فرد . 11 سخت است اما 5 یا 7 می شود. نمی گوید بله یا خیر می گوید این را که مشاهده کردم خیلی خوب بود یا ضعیف بود حداقل چهار تا باشد چون ایجاد واریانس می کند تحلیل عاملی ممکن است
یک مشاهده گر با استفاده از ابزار تحریکی آرامبخش ریچموند وضعیت تحت مراقبت های ویژه را در یک طیف 10 تایی بررسی می کند
تکثر ابزارهای اندازه گیری از سه منظر دیگر قابل بررسی است؟
complexity پیچیدگی
با یک گویه یک سوال پرسیده می شود مثلا تومتر فقط حرارت و ابزار VAS فقط درد را اندازه می گیرد. تک ایتم بودن این ابزار به این معنی نیست که خطای اندازه گیری ندارد به شما پیشنهاد می کنیم که اگر می خواهید این مفاهیم واحد را اندازه بگیرید یک بار اندازه نگیرید چند بار باشد و حداقل دو بار باشد البته با رعایت پروتکل و متوسط آن را گزارش کنید.
composite measure مثل اندازه گیری خود کارامدی که با یک سوال نمی شود اندازه گرفت، کیفیت زندگی، خودمراقبتی و .... نیاز به تشکیلات دیگری دارند.
Unidimensional scale ابعاد تک بعدی ، فقط یک بعد را اندازه می گیرد،
عموما ابزارهایی که می سازیم multidimensional scale هستند خرده مقیاس دارند ابعاد متفاوت دارند مانند ابزار کیفیت زندگی SF-36 این یک ابزار پروفایل است و نمی تواند نمره توتال بدهید و ابعاد را جمع کنید باید بخش های مختلف آن را جدا گزارش کنید
نکاتی در خصوص پیچیدگی ابزار: ابزارهای چند گویه ای اغلب بر ابزارهای تک گویه ای ترجیح داده می شوند. تمایز بین افراد را بهتر نشان میدهد. وجود ایتم های متعدد خطاهای تصادفی را کاهش می دهد.
مطلوب تر این است که وزن هر گویه متفاوت باشد انجام چنین پروسه ای سخت است اما شدنی است ویت کنید بگویید گویه شماره پنج وزنش این قدر است و ... ابزار از حالت یوزرفرندلی خارج می شود اما دقتش بالاست . می توانید نسخه وزن دهی با نسخه بدون وزن را مقایسه کنید اگر تفاوت قابل توجه ای نداشت از نسخه بدون وزن استفاده کنید.
generality
generic and specific measurement
ابزارهای جنریک ابزارهایی هستند که خیلی وابسته به بیماری نیستند و برای همه می شود استفاده کرد
امروزه حجم ابزارسازی در دنیا زیاد شده است یک نیاز جدی است که در دنیا وجود دارد و در کشور ما هم وجود دارد
adaptability
static and adaptive measure ابزارهای پایا و پویا - ابزارهای استتیک: سوالی که طراحی می گنید پاسخ دهنده الزامی ندارد که به سوال قبلی حتما پاسخ بدهد.
ایا شما سیگار می کشید؟ بلی خیر اگر پاسخ شما بلی باشد چند نخ در روز – به این سوالات می گویند آداپتیو. فرم استاتیک بهتر است زیرا فرم آداپتیو بایاس ایجاد می کند و داده گمشده ایجاد می کند missing value
reflective scales and formative indexes ابزارهای انعکاسی و ابزارهای ترکیبی
ابزارهای انعکاسی: مدل شما در معادلات ساختاری (تحلیل عاملی تاییدی)
لیزرل، ایموس،.... و نرم افزارهای دیگر می توانند فقط ابزارهای انالتیک را تحلیل کنند نه ابزارهای فرمیتیو
ابزارهای رفلکتیو: مجموعه ای از گویه هایی هستند که مجموع آن می تواند موید خوب بودن سازه باشد share a common cause عمده ابزارهایی که ما می سازیم رفلکتیو هستند
ابزارهای فورمیتیو، الزاما بین آیتم ها و منطقا بین ایتم ها .... (همسانی درونی را با الفای درونی اندازه می گیرند- garbage in garbage our- محقق است که تصمیم می گیرد به ماشین چه می دهد) همسانی درونی را نمی توان انجام داد و تحلیل عاملی اکتشافی نمی توان انجام داد
در بخش اول مفهوم پردازی، مشخص کردن ابعاد ، تولید آیتم، آیتم پول و اسکلینگ و جنس انواع ابزارها صحبت شد
بخش دوم کارگاه: روایی صوری
از این جا به بعد می خواهیم ایتم ریداکشن کنیم وارد فاز سایکومتریک شدیم گویه های ناجور را بیندازیم بیرون و قدم به قدم برویم جلو، برای تقلیل گویه ها اولین کاری که می کنیم روایی صوری است در فیس ولیدیتی در باره محتوای آن ایتم ها الزاما قضاوت نداریم - از منظر لی پرسون ها روایی ذهنی armchair validity هم از منظر لی پرسون و هم از نظر متخصصان ظاهر گویه ها بررسی می شود
روایی صوری - بلافاصله بعد از این که نسخه اولیه ابزار ساخته شد اولین گامی که باید انجام بدهیم فیس ولیدیتی است. برخی به این موضوع اعتقاد ندارند اما نونالی 1994 می نویسد این اولین گام است. ولی به طور کلی تا کی فرصت داریم؟ تا قبل از روایی سازه
روایی صوری ابزار هم کمی است و هم کیفی - ابتدا باید کمی انجام شود و بعد کیفی انجام شود.
نسخه اولیه آیتم پول یا نسخه ابتدایی یا درفت را بیشتر از صد تا سوال نکنید
در نسخه اول به تکراری بودن توجه نمی کنید بعد می بینید که خیلی واضح همپوشانی دارند
برای هر یک از آیتم های ابزار طیف لیکتری پنج قسمتی زیر در نظر گرفته می شود
1- 5 extremely suitable
2- 4 suitable
3- 3 moderately suitable
4- 2 unsuitable
5- 1 extremely unsuitable
مناسب بودن: میانگین نمرات داده شده به آن آیتم
چند درصد افراد به ایتم یک نمره دادند ؟ فرکونسی یا f آن می شود 70 درصد یا هفتاد صدم
IIM steps
item impact score = frequency (%)
کات پوینت ما می شود 1.5
اگر ایتمی بالای یک و نیم گرفت یعنی آن ایتم مناسب است و اگر ایتمی کمتر از این مقدار گرفت باید revise شود در فیس ولیدیتی هیچ آیتمی را حذف نمی کنیم چرا ؟ ممکن است محتوا خوب باشد ولی ظاهر آیتم خوب نباشد. مثال: آیا در طول شب تعریق می کنید؟ عده ای این سوال را نفهمیدند در حالی که سوال خوبی است و می توان اصلاح کرد آیا در طول شب عرق می کنید.
تعیین کیفی روایی صوری : مصاحبه با تعدادی از آزمودنی ها به صورت چهره به چهره
سطح دشواری (difficulty) دشواری درک عبارات و کلمات
میزان عدم تناسب irrelevancy عدم تناسب احتمالی گویه ها با ابعاد ابزار از منظر پاسخگویان
میزان ابهام ambiguous احتمال وجود برداشت های اشتباه از عبارات و یا وجود نارسایی معانی کلمات
اصلاح و بازنگری گویه ها ... دوست دختر یا جنس مخالف
کارگاه نوبت عصر – CVR و CVI
کمی سازی روایی محتوا quantification of content validity
چرا روایی محتوا مهم است؟ در اعتبار محتوا برای کسب اطمینان از اینکه محتوای آزمون معرف سازه ای است که ادعا می شود آن را می سنجد محتوای آزمون مورد برسی قرار می گیرد
روایی محتوایی به صورت کاملا دقیق = روایی سازه بی دردسر
یعنی ایا این گویه ها ما به ان اندازه کفایت دارد که بتواند سازه را اندازه گیری نماید؟
چرا روایی محتوا مهم است؟ اگر ما روایی سازه را قلب روایی بدانیم و اگر قرار است که روایی سازه بی دردسر داشته باشیم باید روایی محتوا داشته باشیم
به چه کسی خبره می گوییم؟ ویژگی هایی دارد
تعیین روایی محتوا : به صورت کیفی و کمی انجام می شود
کیفی یعنی همان که از خبرگان می خواهیم که گویه ها ایا مناسب هستند یا نه
بررسی روایی محتوا به صورت کیفی: در این روش با تعدادی از متخصصان مصاحبه صورت گرفته و یا از ایشان خواسته می شود تا پس از مطالعه دقیق ابزار دیدگاه های اصلاحی خود را به صورت مربوط و کتبی ارائه نمایند
1- در مورد گرامر .
2- در مورد کلمات / هم به یک متخصص زبان شناس بدهید (در وجه حداکثری کار)
3- در مورد تخصیص گویه ها – محل قرار گیری گویه ها - سوالی که من شماره یک قرار دادم باید شماره یک باشد یا نه؟ ممکن است بگوید سوال یک حساسیت برانگیز باشد پس در سوالات اول قرار نمی دهیم. سوالات دموگرافیک باید در اخر و انتهای پرسشنامه قرار بگیرد.
4- در مورد scaling : چه طیفی انتخاب کنیم؟ طیف لیکرت باشد؟ یا کیو سورت باشد ؟ یا افتراق معنایی یا طیف فاصله اجتماعی بوگارتوس و گاتمن. البته این دو مورد اخر بیشتر در علوم اجتماعی استفاده می شود.
در باره نقطه وسط طیف همیشه یک ماجرا وجود دارد، نظری ندارم را جه می کنید؟
5 –clarity قبلا در قالب CVI اندازه گیری می کرفتند ولی الان می گویند....
6- simplicity
شاخص های مهم روایی محتوا - کیفی : لاوشه CBR ،
کاپا؟ یادداشت نکردم ....
نسبت روایی محتوا CVR درخواست از پانل خبرگان جهت بررسی هر آیتم بر اساس
1- ضروری است
2- مفید است ولی ضروری نیست
3- ضرورتی ندارد
نباید CVR و CVI را همزمان انجام داد باید اول سی وی آر CVR را انجام داد و تغییرات را اعمال کنید و سپس سی وی آی CVI را انجام دهید
در روایی محتوایی 10 نفر انتخاب می کنیم و تا 15 نفر هم می شود در سی وی آی 8 تا 10 تفر انتخاب می کنیم
حداقل باید 50 درصد افراد بگویند که این گویه ضروری است وگرنه منفی می شود و باید آن را انداخت دور
CVR= ne-(N/2)
N/2
ne= تعداد اعضای پانل که می گویند یک گویه ضروری است
1= ضروری نیست 2=مفیداست ولی ضرورت ندارد 3 ضروری است.
عدد به دست امده را با جدول لاوشه مقایسه می کنیم
نقطه برش
تعداد پنالیست ها
انهایی که ضروری نیستند حذف می شوند
بی رحمانه حذف کنید هیچگونه دلرحمی نداشته باشید
content validity index CVI - waltz & bausel
CVI=تعداد ارزیابانی که نمره 3 یا 4 می دهند
تعداد کل ارزیابان
در ادبیات جدید می گویند i-cvi & s-cvi using modified kappa (k*)- polit
لین و پولیت و بک بر این باورند که منحصرا اندازه گیری مرتبط بودن کفایت می کند که به نظر می رسد این مورد اخیر مورد توافق اکثریت متخصصان ابزار سازی قرار گرفته است
در محاسبه ایندکس روایی محتوا بررسی مرتبط بودن از اهمیت بیشتر برخوردار است و طیف رتبه بندی این شاخص را نیز به شکل زیر پیشنهاد شده است
1- مرتبط نیست 2- تا اندازه ای مرتبط است 3 – مرتبط است 4- کاملا مرتبط است.
دست نوشته هایی از کارگاه طراحی ابزار، روز دوم: دکتر حمید شریف نیا
کانسترک ولیدیتی Construct validity
مقالات مجله nursing measurement صد درصد ابزارسازی است
Nunally می گوید ولدیتی سازه قلب ابزارسازی است یک عدد دو رقمی اگر عدد مناسبی نباشد زحمت پنج سال دانشجوی دکترای پرستاری از بین می رود
در ایران هر کسی که مقاله ابزار بنویسد من یکی از داوران او هستم و تقریبا در اکثر موارد آن را رد می کنم
چرا این مفهوم باید اندازه گرفته شود و اگر اندازه نگرفته نشود چه پیامدی خواهد داشت؟ این مورد بسیار مهم است
کجاهای کار آسیب پذیر است ؟
مدل های مختلفی برای ولدیتی سازه وجود دارد. روایی یعنی شایستگی و گفایت. ایا شایسته است؟ ایا این سازه شایسته است؟ این سازه ای که ساختیم شایسته است؟ این ابزاری که ساختیم این وسیله اندازه گیری که ساختیم به درد به خور است؟ روایی سازه این کار را برای ما انجام می دهد. روایی سازه شکل های مختلفی دارد. مفهوم مرگ در فردی که اصلا تجربه مرگ نداشته است با مفهوم مرگ نزد کسی که در مرحله پایان عمر است متفاوت است و سازه باید بتواند این را نشان دهد.
قویترین و معتبرترین روایی سازه: توسط تحلیل عاملی اکتشافی در این کارگاه گفته می شود تحلیل عاملی تاییدی را در کارگاه های پیشرفته دیگر می گوییم.
محقق به دنبال این است که بداند :
(اگر گفتم متغیر منظورم همان گویه/سوال پرسشنامه است. شبکه ماتریسی که رسم می کنید باید به این سوالات پاسخ بدهد)
ایا همبستگی و یا ارتباطی بین متغیرهای حاضر وجود دارد یا نه
اگر وجود دارد ارتباط بین کدام متغیرها بیشتر است؟
ایا می توان یک الگویی برای دسته بندی این متغیرها ایجاد کرد و ان ها را به گروهایی مرتبط کرد؟
هر متغیر چقدر با گروهی که بدان اختصاص یافته مرتبط است؟
یک مثال ساده: در دانشگاه ها معاونت های مختلف داریم چه چیزی باشد که من و یا شما برویم معاونت پژوهشی و بشویم پرسنل آنها؟ علاقه ما است؟ سابقه پژوهشی آنها است؟
مردم مضطرب چگونه خود را تعریف می کنند؟ سوال خوبی نیست منظور ما دلشوره است؟ ترس است؟ ترس درونی است؟ ترس بیرونی است؟ سوال پایا reliable نیست اگر دوباره از شما این سوال را بپرسم پاسخ دیگری می دهید. فقط یک سوال است. بهتر نیست که این سوال را به این صورت بپرسیم؟ و به صورت لیکرتی
1-فرد مضطربی هستم، 2 فرد پرتنشی هستم، 3-فرد.............................
جدول 3-1- پاسخ 9 نفر به 6 سوال
متغیرها
نوشتن مقاله ابزارسازی سلیقه ای نیست اصول خاصی باید رعایت شود
ارتباط بین اضطراب و تنش 74/0 است یعنی اگر اضطراب بالا برود تنش آن هم بالا می رود به احتمال 95درصد ....
وقتی گویه در خروجی منفی می شود باید طیف نمره دهی را برعکس کرد نباید جهت گویه را عوض کنید در تحلیل در SPSS باید نمره ریورس شود.
مفهوم R2 یعنی ضریب تعیین یا ضریب تبیین: ضریب همبستگی را اگر به توان دو برسانیم. R2 بین اضطراب و تنش می شود 5/0 یعنی پنجاه درصد علت تنشن، اضطراب است، هر چقدر R2 بالاتر باشد یعنی قویتر است.
در تحلیل عامل قرار است چه اتفاقی بیفتد؟ عامل چیست؟ (این کلمات تخصصی تخصصی است و حتما از این کلمات در مقالات استفاده کنید) واژه ای داریم به اسم متغیر پنهان و متغیر مشاهده ای – عامل یعنی دسته بندی هایی که درست می شود آن مفهومی که در ذهن من و شما است و مستقیم اندازه گیری نمی شود مفهوم کیفیت زندگی را نمی توان مستقیم اندازه گرفت عامل است پنهان است باید با یک سری متغیرهای مشاهده ای آن را اندازه گرفت.
latent variable به ابعاد می گویند، ابعاد پرسشنامه کیفیت زندگی می شود متغیر پنهان
observed v
چرا تحلیل عاملی اکتشافی انجام می دهیم؟ می خواهیم کشف کنیم که مردم امید یا سلامت جسمی را چه جوری معنی می کنند؟ مثلا زندگی خوب چیست؟ تعریف ما چیست؟ قرار است که کشف کند که ادم ها این مفهوم بزرگ را چند مدل معنی می کنند؟ ابعاد پرسشنامه از کجا به دست آمده است؟ محقق رفته است کشف کرده است که در ذهن مردم این مفهوم چه تعاریفی دارد
در مقدمه باید یک پاراگراف کلیدی داشته باشید که مفهوم .....
تحلیل عاملی اکتشافی به ما نشان میدهد که به جای اینکه 40 تا 50 سوال پراکنده داشته باشیم همان سوالات را دسته بندی شده خواهیم داشت
هدف از تحلیل عامل چیست؟ تقلیل داده data reduction است. منظور حذف گویه ها نیست (data summery) منظور دسته بندی داده ها است
انواع واریانس
چرا در جایی که احتمال می دهیم برای مثال اثر آوای قران سبب افزایش معنویت شود ولی این اثر ایجاد نشده است؟
اول باید سوال بده را تقلیل دهیم بعد اونکوا انجام بده
مفهوم سازه واریانس یک چیزی است که چیز دیگری را توضیح می دهد اگر این بچه افت تحصیلی دارد به دلیل جدا شدن از پدر و مادر است.
مهمترین و اریانسی که داریم واریانس مشترک است مثال: پرسشنامه ای در باره تبعیت درمان ساختید واریانس مشترک می گوید این 20 سوال چقدر می توانند دست به دست هم بدهند که مفهوم تبعیت از درمان را توضیح بدهند اما واریانس ویژه یعنی هر سوال خودش به تنهایی آن مفهوم کیفیت زندگی را توضیح می دهد؟ یا نه . واریانس خطا یعنی بخشی از توضیحی که داره می دهد ناشی از خطای اندازه گیری ما نیست. این تعداد واریانس تکنیکی را ایجاد می کند به اسم PCA یعنی تحلیل و با تحلیل عامل اکتشافی بسیار متفاوت است Principle Component Analysis وقتی با پی سی ای واریانس 49درصد گزارش شده است یعنی ابزار ما اعتباری ندارد و اگر EFA تحلیل عاملی اکتشافی انجام دهید می بینید مقدار کمتر گزارش می شود . ....
وقتی دانشجو کار کیفی می کند و بعد ابزار می سازد
یعنی از تجربیات پنهان به یک مفهوم و پاسخ می رسد
وقتی مفهوم پنهان باعث می شود که ما پاسخ بدهیم باید EFA انجام شود
اگر انجام نشود اشتباه است
مدل های ترکیبی PCA یا فورمیتیو برای دانشجویان رشته اقتصاد و بانک است نه برای پرستاری که ابتدا کار کیفی انجام میدهند پس از این به بعد ما با PCA کار نداریم
پس EFA مفهومی است که به سوالات شما پاسخ می دهد
گام های اصلی تحلیل عاملی
1- مشخص کردن هدف پژوهش – تقلیل داده ها و یا تعیین ساختار عامل پنهان
2- ارزیابی فرضیات مورد نیاز
3-انتخاب روش استخراج عامل ها یا مولفه ها
4-تعیین تعداد عوامل مناسب برای استخراج
5-محاسبه ماتریکس همبستگی تمام نتعیرها
6- دوران عامل های استخراج شده
7- انتخاب گویه ها و ایتم ها
8- نام گذاری و تعریف عامل ها
9- ارزیابی همبستگی بین عامل ها و یا مولفه های استخراج شده
10- ارزیابی پایایی عامل ها و مولفه های استخراج شده
11- تفسیر نهایی نتایج و گزارش یافته ها
وقتی حجم نمونه را خیلی بزرگ کنید ایجاد خطای آماری می کند . در مدل سازی و تحلیل عاملی بر عکس است هر چه نمونه بیشتر باشد بهتر است قدرت شما را بالاتر می برد کمتر از 200 تا اصلا قبول کنید - باید در متد خود رفرنس بدهید که بر اساس چه الگویی از یک قانون سرانگشتی استفاده کردید؟ اگر می خواهید تحلیل عاملی اکتشافی و تاییدی انجام بدهید حداقل 400 تا انجام دهید. یک فرمول بزرگ و پیچیده است که در انتهای کار به شما می گوید که این نتیجه شما پاور است یا پاور نیست اما من به شما توصیه نمی کنم.
معمولا کارهایی که انجام میدهیم طیف لیکرت است. توزیع طبیعی داده ها در ابزار سازی را با شاپرویلک نمی توانید بسنجید به دو صورت باید ارزیابی کنید و گزارش نمایید: 1= ابتدا توسط
univariate و 2= multivariate سپس توسط ارزیابی شد
مورد اول را با skewness
مورد دوم kortos با ارزیابی می شود
سپس از mardia استفاده می شود
داده های پرت outlayer باید چک شود و سپس توسط ضریب mahalonobis d-square چک می شود
پاشنه آشیل بعدی missing data است حتی اگر یک نفر به یک سوال جواب ندهد اصلا نرم افزار اجازه نمی دهد که شما تحلیل عامل انجام دهید باید در مقاله گزارش کنید که چند درصد داده مفقوده داشتید و برای رفع مشکل چه کار کردید. اگر بالای 10 درصد باشد باید ان افراد را کنار بگذارید و افراد جدیدی را وارد پژوهش کنید.
- قابلیت ساخته شدن factor ability زمانی یک فاکتور، فاکتور است که یکسری استاندارد داشته باشد یکی از انها این است که هر عامل باید سه گویه داشته باشد تا یک عامل محسوب شود.
دانشگاه آزاد علی آباد کتول، گلستان، پنجشنبه 5 اردیبهشت 98 - ساعت 10:34
ادامه گام های اصلی تحلیل عامل
می توان از معیار کیزر استفاده کرد می توان از تست پارالل هم می شود استفاده کرد و سخت است و برنامه نویسی باید انجام شود از این رو اکثرا از معیار کیزر استفاده می کنند ولی اگر از پارالل استفاده کنید خیلی کارتان قوی می شود
مورد 6- بسیار حیاتی است به ان دوران یا روتیشن می گویند که صد درصد باید در مقاله گزارش شود بی نهایت مهم است.
مورد 7 - انتخاب گویه ها و ایتم ها؟ با چه فرمولی باشد؟
تمام 11 گام باید اجرا شود
مورد 8 - می توانید لیبل بگذارید یا نگذارید اما اگر به عامل ها اسم بدهید خیلی کارتان قشنگ تر می شود
مورد 9 – ارزیابی کورلیشن بین عامل ها باید گزارش شود
مورد 10 - در باره پایایی هر عامل
مورد 11 – تفسیر نهایی نتایج و گزارش یافته ها ، سلیقه ای نیست باید عین الگو انجام شو
سوال پژوهش ما چیست؟
می خواهیم PCA کنیم یا می خواهیم EFA کنیم؟ این مفاهیم کدام ها هستند چه گویه هایی به ان اختصاص می یابد
- در کتاب به طور مفصل در باره سطح اندازه گیری و حجم نمونه نوشتیم
-نقاط پرست در داده ها
- در باره میسینگ داده ها هم گفتم
در باره factor ability هم گفتیم
در باره هم خطی چندگانه muliticollineariy که یا در رگرسیون خطی و در انکووا وجود دارد
یعنی دوست نداریم سوالات پرسشنامه مان خیلی با هم کورلیشن داشته باشند اگر به شدت باشد و ما نمی دانیم طلاق باعث افت تحصیلی شده یا افت تحصیلی سبب طلاق شده است اگر کورلیشن بیش از یک باشد یعنی هم خطی چندگانه اتفاق افتاده است پس باید چه کرد؟ باید سوالی که سبب این مشکل شده است را حذف کنید. در کانستراکت ولیدیتی سوال بده دور انداخته می شود
- در خصوص اندازه ی کفایت نمونه گیری KMO Kaiser-Meyer-Olkin و Bartlett
در مقالات ابزارسازی R2 را h2 می نویسند
KMO از 7/0 به بالا قابل قبول است. ولی عدد خوب 9/0 است عدد بین 0 تا 1 است مثل الفا کرونباخ است که از 7/0 به بالا می گوییم خوب است اما هر چه بیشتر باشد خوب است باید در مقاله گزارش کنید . بارتلت ازمون فرضیه ای است که پی آن باید معنی دار باشد وگرنه نرم افزار چیزی انجام نمی دهد اصلا کاری نمیکند بارتلت باید معنی دار باشد ولی معنی داری آن ما را خوشحال نمی کند با حجم نمونه بالای 50 معنی دار می شود ولی دلیل ارزش نمی شود
گام چهارم ما روش استخراج عامل ها بود
- اگر کسی رساله دکترایش ابزارسازی است اصلا کاری به PCA نداشته باشد
principal components analysis
- …..
گام پنج ما شاخص تعیین استخراج تعداد عامل است
شاخص کیزر مهم ترین آن آیتن ولیو یک است در نرم افزار spss وجود دارد
eigen value>1
scree plot
variance extracted
دوران عامل ها- دوران یا چرخش عامل های استخراج شده
چرا این بعد را می گوییم تبعیت درمان؟ چرخش انجام می دهیم تا بتوانیم اسمی را که گذاشتیم خوب بتوانیم توضیح بدهیم ، ما دوست داریم هر سوالی کورلیشن نزدیک به صفر باشد یا نزدیک به یک باشد
ما دوست داریم عامل های ما تک قطبی باشد دوست نداریم که در یک بعد ، یک سوال منفی باشد، یک سوال مثبت باشد اما انالیز می کنید می بینید این طور است انالیز می کنید می بینید روتیشن شما اشتباه بوده است مثلا پرسشنامه معنوی سلامت دو بعد دارد: بعد یک یا فاکتور یک و بعد دو یا فاکتور دو
متغیرها هم سوالات پرسشنامه ما است اما کدام سوال مربوط به کدام بعد است؟ نمیدانیم ما باید به نرم افزار بگوییم که این سوالات را بچرخاند اما چه جور چرخشی؟ چرخش زاویه عمود یا اورتوگونال یعنی عامل یک و عامل دو هیچ کورلیشنی با هم ندارند .
ما پروفایل یعنی ابعاد را با هم جمع نمی کنیم
نرم افزار SPSS سه تا چرخش دارد: واریمکسی، اکیومکس و کوایمکس
اگر زاویه 90 را بشکنید می توانید بفهمید که عامل های ما کورلیشن دارند و پروفایل نیستند (در پروفایل ابعاد قابل جمع شدن نیستند)
نرم افزارهای دیگر چرخش های دیگری دارند
چرخش ابلیک و پرامکس چرخش مایل هستند و باید حتما در مقاله خود گزارش کنید
اگر عامل های بیش از 32/0 با هم کورلیشن داشته باشند ان عامل ها، عامل های مایل به یکدیگر هستند
کلید واژه ها:
factor loading یا بار عملی - از این به بعد در مقاله تحلیل عاملی ننویسید کورلیشن بلکه باید بنویسید فکتور لودینگ
یک مثال واقعی گویه: لمس جسد برای من لذت بخش است با طیف لیکرت پنج تایی
بار این عامل منفی می شود معنی این است که نه لذت بخش نیست
توصیه نمی شود که ساقه سوال منفی شود
می شود نمره گذاری سوال را برعکس کنید
اگر الفا کرونباخ بگیرید عدد آن کم می شود 4/0 یا 5/0 یا باید سوال حذف شود یا باید اسکورینگ آن معکوس شود.
....
1- داده ها را وارد اس پی اس اس می کنید
البته پیش فرض ها را رعایت کنید: نرمالیتی چک شود و آوت لایر چک شود
ادامه را ننوشتم ...
مروری بر مراحل شروع طراحی ابزار
1- لازم است که متغیر اندازه گرفته شود؟ ابزار وجود ندارد یا دارد باید اصلاح شود
2-رویکرد خود را برای حرکت به سمت ساخت مشخص کنیم. با رویکرد کیفی پیش برویم یا بررسی متون یا می خواهیم تطابق فرهنگی انجام بدهیم و فقط ترجمه کنیم
3-رویکرد کیفی خود را مشخص کنید با رویکرد گراندد کار نکنید از ابتدا سراغ تحلیل محتوا یا هیبرید جلو بروید
4- وارد مرحله تولید گویه ها شوید – استخر گویه ها را بسازید
5- اعتبار صوری انجام شود ایا سوالات قابل فهم و درک برای گروه هدف است
6- متخصصان پاسخ بدهند سوالات قابل فهم و درک است یا نه
7- متخصص جواب بدهد ایا سوالات ضرورت دارند CVI و CVR تعیین می شود
8 – روایی سازه: چقدر می تواند مفهوم را اندازه بگیرد - اعتبار را اندازه بگیرید
9- پایایی ابزار – چقدر قابل اعتماد است؟
نوبت عصر کارگاه
آیتم آنالیز یعنی قبل از این کار سازه را انجام دهید
یعنی با 30 تا نمونه آنالیز کنید اگر الفا کم بود گویه بد را پیدا کنید بعد نمونه گیری را ادامه دهید
بحث پایایی یک هدف خاص دارد در روایی داخلی یعنی چقدر اون چیزی را که باید اندازه بگیرد اندازه می گیرد اما پایایی یعنی اگر
در کتاب مبانی ابزار سازی نوشته ایم: این جمله اشتباه است که بگوییم پایایی ابزار در مطالعه دیگران خوب بوده است در مطالعه شما چطور بوده است ؟ چقدر این نمره تحت تاثیر خطاها قرار گرفته است. پایایی چیزی نیست به جز گزارش خطاها پس باید کات اف داشته باشیم که اگر بیش از این میزان خطا شد دیگر نمی پذیریم
ایا اندازه گیری در طول یک پریود ثابت است
اگر این هفته امیدوارم هفته بعد هم امیدوار خواهم بود
واژه stability واژه مناسب تر از reliability است و همان پایایی است
در مواردی که مفهوم متغیر است این هفته امیدواره و هفته بعد ناامید پس استفاده از تست- ری تست مناسب نیست
واژه های معادل
1- قابلیت اعتماد dependeability
2- سازگاری consistency
3- ثبات stability
4- قابلیت پیش بینی predictabilty
5-دقت و صحت accuracy
ان چیزهایی که قرار است یک مفهوم را اندازه بگیرند ایا همه حول یک مفهوم می چرخند
ثبات دارند یکسان هستند همه دنبال سنجیدن امید هستند یا دنبال تبعیت درمان هستند
الف- ثبات
1- پایایی به شکل بازازمون – فاصله زمانی بین دو ازمون حتی می تواند تا شش ماه باشد ولی عمدتا دو هفته است.
اشتباه است اگر برای تست ری تست ضریب همبستگی r انجام دهید ، ضریب همبستگی پیرسون زمانی انجام می دهیم که دو متغیر مستقل از هم باشند مثل قند و چربی r یعنی اگر یکی زیاد شود یکی دیگر هم زیاد می شود قند بالا بره چربی خون هم زیاد می شه ، پس چه چیزی تست شود؟ در تست ری تست باید ICC چک شود. پایایی نسبی گفته می شود چه جوری این کار را می کنیم؟
مثال
نمره ترس از مرگ در هفته اول
نمره ترس از مرگ در هفته دوم
در ICC خروجی ما جدولی می شود .... که بالای 7.0 را خوب تلقی می کنیم اما بالای 9.0 را خیلی بهتر.
حجم نمونه در تست ری تست باید با نرم افزار پاور محاسبه شود ممکن است 10 تا یا 20 تا یا 30 تا لازم شود
ICC intraclass correlation coefficient
گزارش فاصله اطمینان در آی سی سی بسیار مهم است بخصوص دم پایین آن – فاصله اطمینان دمش نباید کمتر از 7/0 باشد
اگر فاصله اطمینان ما بسیار وسیع باشد چه باید کرد؟ پاسخ در کارگاه پیشرفته گفته می شود
اگر ابزاری مثل VAS داشتید باید ICC گزارش کنید
ضریب کاپا: جهت اندازه گیری توافق فراتر از شانس بین دو ارزیاب معرفی شد
اتفاق نظری بین دو ارزیاب وجود دارد تا چه اندازه فراتر از اتفاق نظری است که بر حسب شانس و تصادف باشد یا نباشد
کاپای کوهن در مواردی به کار می بریم که متغیر دو حالتی داشته باشیم
اگر توافق وجود نداشت اون وسیله بد است نه ما - نمی توانیم دو متخصص داخلی را بگویم بد هستند چون نتوانستند با این گرافی امفیزم را تشخیص دهند
باید از روش دیگری استفاده کنیم از ابزار مناسب دیگری استفاده کنیم
وقتی پاسخ ها فقط و فقط دو حالت است به صورت بله و خیر، باید از ضریب کاپا استفاده کرد
چگونه باید نتیجه پایایی کوهن را گزارش کرد؟ بیش از 75 یعنی توافق خوب است و اگر 40 تا 75 باشد یعنی این وسیله خوب نیست و اگر کمتر از 40 باشد اصلا خوب نیست
اگر به جای بله و خیر سوالات به صورتی بود که پاسخ لیکرتی باشد خم در صورت: خفیف، متوسط، شدید، ...
در نرم افزار اس پی اس اس می توانید از ویتت کاپا استفاده کنید weighted kappa
حالت چهارم : دانشجوی تربیت بدنی ابزارسازی کند هدف این بود که ابزاری بسازد که غربالگری اسیب های ورزشکاران را اندازه گیری کند
گویه ها اسمی بود: ایا موقعی که ورزشکار اسکات می زند کمرش خم می شود به جلو؟ یا .... این طوری می شود؟ یا فلسی کاپا در نرم افزار spss نیست اما می توانید فلسی کاپا را تعریف کنید و درست کنید
برای سوالات مشابه سوال امتحانی نمی توانید از کاپا معمولی استفاده کرد باید از کاپای فلسی استفاده کرد.
افتراق مک نمار (مثلا مفهومی مثل امید که در طول زمان تغییر می کند) با کاپای کوهن ؟
2- پایایی به شکل موازی: یک ابزار مشابه دارید
ب) سازگاری
3-روش کودر ریچاردسون
4- روش دو نیمه کردن : زمانی که برای مثال 20 سوال دارید وآن را دو نیمه می کنید
5- ضریب الفای کرونباخ ، تتا و امگا مک دونالد
الفای کرونباخ برای ابزارهای انعکاسی (رفلکتیو) استفاده می شود.
پرسشنامه ای ساخته شده است که علامت های کانسر را بررسی می کند
ایا می توانید الفای کرونباخ گزارش کنید؟
الفا کرونباخ در ابزارهایی کاربرد دارد که رفلکتیو باشد
الفای کرونباخ شدید تحت تاثیر حجم نمونه است.
ایراد بزرگ: الفای کرونباخ: همه گویه ها الفای کرونباخ تحت تاثیر حجم نمونه است.
بنای الفای کرونباخ ضریب همبستگی پیرسون است
نکته خیلی مهم: اگر گویه ها محدود بود چه کنیم؟ و الفا کرونباخ پایین بود؟
ضریب تتا و ضریب امگا مک دونالد
تتا: موقعی کاربرد دارد که PCA استفاده کرده باشید قرار بود که پی سی ای استفاده نکنیم
اما امگا مک دونالد چه زمانی استفاده می شود؟
بخش زیادی را دست نویس نکردم
نمونه هایی از مجلاتی که در پرستاری مقالات ابزار سازی را چاپ می کنند
The Journal of Nursing Measurement
https://www.scimagojr.com/journalsearch.php?q=28234&tip=sid
به دلیل نزدیکی مکان برگزاری کارگاه پس از اتمام کارگاه من و دکتر ثناگو به دیدن آبشار زیبای کبودوال علی آباد کتول رفتیم