По поводу тс темы в понедельник иду к психологу на повторное обследование. На первом, еще в мае, нашли следы "эндогенного процесса", шизы то есть, сейчас вот решили повторить в свете пересмотра диагноза и того, что сексолог подтвердил тс. Психиатр сказала, чтобы тест хорошо прошел, сконцентрировался, чтобы не было всяких соскальзываний мышления и подобного
По учебе курсовик делается. Но это очень сложно и медленно
Я нашел хороший алгоритм по одновременному построению массива суффиксов (SA) и массива общего префикса (LCP), и я знаю как эту структуру данных применять для нахождения тандемных повторов. Была проблема с одновременным построением SA и LCP. Я раньше хотел использовать дерево суффиксов, а не массив, но он кучу памяти жрет, да и медленнее чем массив. Например, дерево суффиксов, построенное на основе человеческого генома занимает в памяти 40 гигабайт. Массив поменьше, но все равно много, поэтому придется все равно использовать структуры данных для работы с внешней памятью, в биоинформатике они неизбежны. Сегодня изучал эти структуры
STXXL: Welcome to STXXL В общем как видишь очень тяжко и медленно идет процесс
Еще может возникнуть проблема с наивным алгоритмом нахождения тандемных повторов на основании LCP. Этот алгоритмы 1992 года, статью прочитал
Статистический анализ оценки алгоритма изучил. Будет использоваться анализ вариаций в сочетании с методом Тьюки.