#2 Re: Програмування Arduino » Регістрова змінна » 2025-09-06 16:58:24

MikeM пише:

Звичайно, обробки, швидше ніж таблична, не існує.

Та не завжди. Залежить від алгоритму та особливостей архітектури. Хоча, спеціалізовані інструкції, по суті, на таких же "таблицях" реалізовані, тільки вони містяться на самому кристалі.
Звісно, в загальному випадку нічого швидше за O(1) не існує, але в конкретних випадках бувають нюанси. В мультизадачному середовищі взагалі, ще питання, що краще: виконати кілька додаткових інструкцій, чи лазити в таблицю через спільний кеш.

MikeM пише:

Однак, не варто було одразу викладати код. JOKEERу весь кайф обламали.

Вибачте, не хотів. Здавалось очевидним. Але там є ще простір для подальшої оптимізації wink

#3 Re: Програмування Arduino » Регістрова змінна » 2025-09-06 12:00:16

dimich пише:

Звісно, BCD можна упакувати. Тоді таблиці будуть менші, але виконання трохи довшим.

А якщо правильно упакувати, то і таблиці в півтора раза менші, і виконання навіть швидше. Має вийти десь 5.5 мкс.

const uint16_t PROGMEM intr[512] = { 0x000, 0x001, ... 0x510, 0x511 };
const uint16_t PROGMEM frac[128] = { 0x000, 0x008, ... 0x984, 0x992 };
char out[6];

void convert(uint32_t n)
{
    char *dst = out;
    uint16_t d;
    d = pgm_read_word(intr + ((n >> 19) & 511));
    *dst++ = d >> 8;
    *dst++ = (d >> 4) & 0xf;
    *dst++ = d & 0xf;
    d = pgm_read_word(frac + ((n >> 12) & 127));
    *dst++ = d >> 8;
    *dst++ = (d >> 4) & 0xf;
    *dst = d & 0xf;
}

#4 Re: Програмування Arduino » Регістрова змінна » 2025-09-06 02:26:12

MikeM пише:

У 32-розрядному слові в бітах з 12 по 27 міститься двійковий код 16-розрядного числа з фіксованою крапкою. Старші 9 бітів містять цілу частину, молодші 7 бітів - дробову. Потрібно перетворити його в 6-байтовий код для відображення на екран (по одній двійково-десятковій цифрі в байті).
Задача здається нескладною, але це все треба зробити швидше, ніж за 25 мікросекунд (на 16 МГц 8-бітному Arduino).

Якщо правильно зрозумів вхідний та вихідний формати, то дві таблиці з десятковими цифрами, 3 * (512 + 128) = 1920 байт флеша. Навіть "в лоб", без низькорівневої оптимізації:

const char PROGMEM intr[512 * 3] = {
    0, 0, 0,
    0, 0, 1,
    ...
    5, 1, 0,
    5, 1, 1
}; 

const char PROGMEM frac[128 * 3] = {
    0, 0, 0, 
    0, 0, 8,
    ...
    9, 8, 4,
    9, 9, 2
};

char out[6];

void convert(uint32_t n)
{
    char *dst = out;
    const char *src = intr + 3*((n >> 19) & 511);
    *dst++ = pgm_read_byte(src++);
    *dst++ = pgm_read_byte(src++);
    *dst++ = pgm_read_byte(src++);
    src = frac + 3*((n >> 12) & 127);
    *dst++ = pgm_read_byte(src++);
    *dst++ = pgm_read_byte(src++);
    *dst++ = pgm_read_byte(src++);
}

виходить щось біля сотні тактів, десь 7 мкс.
Звісно, BCD можна упакувати. Тоді таблиці будуть менші, але виконання трохи довшим.

#5 Re: Програмування Arduino » Регістрова змінна » 2025-08-28 12:33:45

MikeM пише:

І ніяких бібліотек.

А SMCR, по-вашому, де визначено? wink На avr-libc і весь ардуіно фреймворк побудований, так що це як раз із бібліотекою. Тільки замість бібліотечної функції чи макроса прямий доступ до регістра. Цілком можна і так, якщо не планується компілювати для контролерів, у яких sleep modes визначаються не через SMCR.

MikeM пише:

Цікаво, що ще пару днів тому я так вже робив. Не запрацювало з-за того, що забув /n/t. Переглянувши бібліотеку зрозумів, у чому був косяк.

Дивно, бо для єдиної інструкції у виразі в asm це не має значення. А для кількох інструкцій без \n була б синтаксична помилка.

jokeer пише:

Не зрозумів роль /n/t

\n для асемблера, бо компілятор спочатку зклеює сусідні строкові літерали, потім передає асемблеру. А асемблеру потрібно розрізняти рядки з мнемоніками. Але для єдиної інструкції це не обовʼязково.
\t для краси, щоби при виводі асемблерного лістингу наступний рядок був з відступом.

#6 Re: Програмування Arduino » Регістрова змінна » 2025-08-28 05:44:59

MikeM пише:

З ваших відповідей я зрозумів, чого не вистачає. Треба зупиняти процессор!

Так. Може це не єдиний, але, мабуть, найпростіший спосіб синхронізувати виконання коду з перериванням.

Обробник переривання не може почати виконуватись посередині 2- чи 3-тактової інструкції. А організувати цикл чи розгалуження без таких інструкцій неможливо. Щоб забезпечити незмінність затримки між виникненням запиту на переривання та виконанням коду, потрібно, щоб запит виникав, коли процесор знаходиться в режимі idle, тобто виконує інструкцію sleep.

MikeM пише:

Нове питання: як це зробити з Arduino IDE?

Що потрібно зробити, написано в даташиті, розділи 9.3 Idle Mode, 9.11.1 SMCR – Sleep Mode Control Register.
Як це можна зробити засобами avr-libc, написано в avr/sleep.h. Цей хідер для вашої версії avr-libc лежить у вас на диску в тулчейні.
Якщо коротко (по запису, не по виконанню):

// Один раз на початку:
set_sleep_mode(SLEEP_MODE_IDLE);
...
// Для входу в режим очікування:
sleep_mode();

Але це оверхед з перестраховкою. Можна простіше:

// Один раз на початку:
set_sleep_mode(SLEEP_MODE_IDLE);
sleep_enable();
...
// Для входу в режим очікування:
sleep_cpu();

IDE тут ні до чого, код писати можна хоч у блокноті. Чи ви маєте на увазі, зробити засобами фреймворка ардуіно? По-перше, зручно використовувати 16-бітний TIMER1 в режимі CTC, бо при 16 МГц одна горизонтальна лінія відповідає циклу таймера в 508 тактів. По-друге, потрібно як мінімум вимкнути переривання від TIMER0, який ардуіно фреймворк використовує для своїх потреб.

#7 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 23:30:40

MikeM пише:

При спробі вивести 18й символ (а місце для нього є і на екрані, і на осциллограмі) таймер збивається.

Що значить "збивається"?

MikeM пише:

Таке враження, що, якщо обробка переривання не завершується за 4 мкс до наступного переривання, то це має негативний вплив.

4 мкс - це 64 такта. Спробую вгадати, ви помістили в обробник чималий шматок коду, який потребує зберігання/відновлення всіх регістрів. 32 інструкції pop по 2 такта в епілозі обробника, от вам і 4 мкс.
По-хорошому, обробник має складатись з єдиної інструкції reti: тільки розбудити процесор зі сплячки і завершитись.

Покажіть же, як ініціалізуєте таймер, що виконується в обробнику, як синхронізуєте переривання з рештою коду.

MikeM пише:

Хто-небудь може щось прояснити?

При наявній на даний момент інформації - можуть хіба що екстрасенси-телепати.

#8 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 16:54:03

jokeR пише:

Колись учили ассемблер x86, там все якось більш зрозуміло було wink

x86 CISC, регістрів менше, а інструкцій більше. А тут RISC, все навпаки smile

#9 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 14:46:00

jokeR пише:

Цікаві досліди winkЗаписуємо 0 після i14? наче в С коді не було. Чи це вже щось наступне?

Старший байт 16-бітної змінної. У автора там наче б то індекс для масиву зі шрифтом.

#10 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 12:54:35

Для демонстрації, мабуть, красивіше так:

$ avr-objdump -dzrwC --no-address --no-show-raw-insn --visualize-jumps test.o
...
<foo()>:
        lds     r24, 0x0000     ; 0x<__SREG__+0x7fffc1> R_AVR_16        serialBuf+0x1
        bst     r24, 2
        eor     r24, r24
        bld     r24, 0
        sts     0x0000, r24     ; 0x<__SREG__+0x7fffc1> R_AVR_16        i14
        sts     0x0000, r1      ; 0x<__SREG__+0x7fffc1> R_AVR_16        i14+0x1

Або просто продукувати лістинг компілятором

$ avr-g++ -mmcu=atmega328p -Os -S -o - test.cc

Але з -flto після лінковки кінцевий результат може бути зовсім іншим, так що це дуже приблизно.

#11 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 11:53:59

jokeR пише:
lds     r24, 0x0000 ; завантажили в r24 те що лежало в RAM за адресою 0х0000? serialBuf? старший байт?

Це дизасемблинг обʼєктного файлу (.o) до релокації, в ньому всі адреси нульові. При лінковці вже лінкер підставить потрібні адреси. Там буде адреса другого байта

jokeR пише:
sts     0x0000, r24 ; зберігаємо 0/1 в 0х0000? назад в serialBuf?

Нє, там буде інша адреса. Тут має бути зрозуміліше: https://godbolt.org/z/zKqrK7szG

jokeR пише:
sts     0x0000, r1  ; а що в r1??

За конвенцією в r1 завжди нуль. Саме тому після інструкцій mul, а також в преамбулі ISR компілятор його обнуляє. Є сумніви щодо доцільності такого рішення, але вже так.

jokeR пише:

А що робить lds-sts - незрозуміло.

Просто завантажує (Load Direct from Data Space) та вивантажує (Store Direct to Data Space) значення регістрів з/в памʼять. Так, в нерелокованому коді нульові адреси збивають з пантелику.

#12 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 08:31:53

Цікаво, що навіть GCC 15.1.0 такий фрагмент:

i14 = (serialBuf & 0x400) == 0 ? 0 : 1;

компілює в короткий 9-тактовий код, а еквівалентний йому

i14 = (serialBuf & 0x400) ? 1 : 0;

в довгий, схожий на той що генерує 7.3.0.

#13 Re: Програмування Arduino » Регістрова змінна » 2025-08-27 05:48:03

MikeM пише:

Намагаюся створити фрагмент програми, час виконання якого не буде залежати від оброблюваних значень. Зіштовхнувся з цікавим ефектом.

  if((serialBuf & 0x200) == 0) {i15 = 0;} else {i15 = 1; __asm__("nopnt");}
  if((serialBuf & 0x400) == 0) {i14 = 0; __asm__("nopnt""nopnt""nopnt");} else {i14 = 1;} 

Час виконання кожного з рядків стабільний, незалежно від значення serialBuf. Але для досягнення такої стабільності треба додавати різну кількість NOPів і, що ще цікавіше, в різні гілки.

По-хорошому, такі фрагменти потрібно одразу писати на асемблері, чи на вбудованому, чи в окремому файлі. Воно-то можна зкомпонувати вирази мовою високого рівня і підібрати необхідну кількість нопів. Але при подальших змінах в коді, чи при компіляції іншою версією, або з іншими опціями згенерований код може стати іншим, і все попливе.

Наприклад, такий код (еквівалентний рядку вашого):

uint32_t serialBuf;
uint16_t i14;

__attribute__((naked)) void foo()
{
    i14 = ((serialBuf & 0x400) == 0) ? 0 : 1;
}

Або, те ж саме:

i14 = !!(serialBuf & 0x400);

GCC версії 15.1.0 з опціями "-mmcu=atmega328p -Os" компілює в

00000000 <_Z3foov>:
   0:   80 91 00 00     lds     r24, 0x0000     ; 0x800000 <__SREG__+0x7fffc1>
   4:   82 fb           bst     r24, 2
   6:   88 27           eor     r24, r24
   8:   80 f9           bld     r24, 0
   a:   80 93 00 00     sts     0x0000, r24     ; 0x800000 <__SREG__+0x7fffc1>
   e:   10 92 00 00     sts     0x0000, r1      ; 0x800000 <__SREG__+0x7fffc1>

9 тактів, ніякої залежності від значень.

А GCC версія 7.3.0 з ардуінівського тулчейна з тими ж опціями компілює в

00000000 <_Z3foov>:
   0:   80 91 00 00     lds     r24, 0x0000     ; 0x800000 <__SREG__+0x7fffc1>
   4:   90 91 00 00     lds     r25, 0x0000     ; 0x800000 <__SREG__+0x7fffc1>
   8:   a0 91 00 00     lds     r26, 0x0000     ; 0x800000 <__SREG__+0x7fffc1>
   c:   b0 91 00 00     lds     r27, 0x0000     ; 0x800000 <__SREG__+0x7fffc1>
  10:   2a e0           ldi     r18, 0x0A       ; 10
  12:   b6 95           lsr     r27
  14:   a7 95           ror     r26
  16:   97 95           ror     r25
  18:   87 95           ror     r24
  1a:   2a 95           dec     r18
  1c:   01 f4           brne    .+0             ; 0x1e <_Z3foov+0x1e>
  1e:   81 70           andi    r24, 0x01       ; 1
  20:   99 27           eor     r25, r25
  22:   90 93 00 00     sts     0x0000, r25     ; 0x800000 <__SREG__+0x7fffc1>
  26:   80 93 00 00     sts     0x0000, r24     ; 0x800000 <__SREG__+0x7fffc1>

Дивіться дизассемблером, що генерується в кожному окремому випадку. Контекст виклику також істотно впливає на результат.
Можна за допомогою "avr-objdump -dz firmware.elf". Якщо збираєте власним Makefile, то генерацію асемблерного лістингу автоматизувати просто. В platformio також можна.
Опцією -S можна тимчасово вказати компілятору, щоб замість обʼєктного продукував асемблерний файл і на тому зупинявся.
Можна зберігати проміжні результати компіляції опцією -save-temps.
Для швидкого аналізу коду, що генерується, можна користустуватись godbolt.org. Тільки avr-gcc 7.3.0 чомусь там не знайшов.
Також майте на увазі, що link time optimization (опція -flto) може кардинально змінити код в результуючому .elf порівняно з тим, що в обʼєктному файлі. Тому кінцевий результат потрібно дивитись objdump'ом на .elf.

MikeM пише:

Звичайно, можна попередньо розібрати слово по байтах, але на це витрачається неприпустимо багато часу.

По суті, на обробку даних у вас є тільки час вертикального зворотнього "ходу променю".
Якщо горизонтальна синхронізація (HSync) генерується апаратно таймером по Output Compare Match, то це безперервний інтервал в 1.4 мс, тобто більше 22000 тактів. Плюс декілька десятків тактів під час кожного горизонтального синхроімпульсу та back porch.
Якщо HSync програмна на GPIO, то цей інтервал потрібно розбивати на безперервні фрагменти не більше як десь по 450 тактів.

#14 Re: Програмування Arduino » Регістрова змінна » 2025-08-24 20:07:25

jokeer пише:

Можливо компілятор і сам здогадатися розгорнути цикл,  без підказок.

З дефолтовим -Os навряд чи.

#15 Re: Програмування Arduino » Регістрова змінна » 2025-08-24 19:56:32

MikeM пише:
dimich пише:

#pragma GCC unroll 25

Нічого не змінюється, включно з розміром скомпільованого файлу.

Дивно. Ви ж це безпосередньо перед циклом "for" написали, а не десь на початку?
А, мабуть ви користуєтесь ардуінівським тулчейном з GCC 7.3.0. Ця прагма зʼявилась в GCC 8.
Просто я собі для platformio зробив пакунок atmelavr, який використовує avr-gcc, встановлений в системі (на даний момент 15.1.0), а не з їхнього репозиторію, який вони самі тягнуть з ардуїнівського з версією GCC часів Давньої Греції. Тоді вибачаюсь, не подумав перед тим як радити, що у людей це може не працювати.

#16 Re: Програмування Arduino » Регістрова змінна » 2025-08-24 19:28:36

MikeM пише:

При формуванні порожнього екранного рядка визначаються 25 символів, які будуть відображатися в наступних N рядках і в змінні і0 ... і24 записуються стартові адреси описів відповідних символів в кодовій таблиці.

А, здається, зрозумів. Ви тримаєте таблицю заздалегідь порахованих зміщень. Ну, можна й так, якщо ресурсу вистачає. У мене був символьний буфер на весь екран, здається 25x8.5 при шрифті 8x14, і коди символів з нього вибирались на кожній ітерації.

MikeM пише:

Хвіст, що може тягнутися за символом враховано. Останній біт завжди нульовий

Якщо тільки цифри, то можна було б зробити ширину символа 4 пікселя. Тоді в рядок в два рази більше влізе. Та й висоту не обовʼязково кратну 8. Ну то таке, вам постановка задачі та пріорітети фіч видніше.

#17 Re: Програмування Arduino » Регістрова змінна » 2025-08-24 18:24:24

MikeM пише:

бекслеші чомусь з'їдаються

Баг форума. Їх потрібно дублювати. І після попереднього перегляду також. Дуже незручно.

MikeM пише:

SPDR = codePage[i0++]; __asm__("nopnt""nopnt""nopnt""nopnt""nopnt""nopnt");// бекслеші чомусь з'їдаються
    ...
SPDR = codePage[i24++]; __asm__("nopnt""nopnt""nopnt""nopnt""nopnt""nopnt");// бекслеші чомусь з'їдаються

Якщо використовувати цикл (звичайно, без NOPів, з'являється додаткова затримка, впоратись з якою не вдається

Можна перед циклом вказати #pragma GCC unroll N, де N дорівнює або більше кількості ітерацій.

#pragma GCC unroll 25
for (uint8_t i = 0; i < 25; i++) {
   ...
}

Тоді компілятор має повністю розгорнути цикл, якщо кількість ітерацій відома на момент компіляції.

Ітерація цикла з перевіркою умови в рантаймі на AVR виконується мінімум за 3 такта. А у вас ще й пост-інкремент різних змінних, для яких компілятор не має змоги застосувати інструкцію LD з пост-інкрементом.
Було б корисно подивитись дизасемблером, що там компілятор нагенерував, і порахувати такти.

Мені невідома логіка побудови растру у вашій програмі, тому не дуже розумію, навіщо на кожну колонку окрема змінна. Може це теж можна оптимізувати. Памʼятаю, мені вдавалось зекономити декілька тактів, змінивши формат зберігання шрифта на interlaced (переплетений?): зазвичай шрифт зберігається по порядку символів: спочатку N байт першого символа, де N - висота в пікселях, потім N байт другого і т.д. А у мене формат був: спочатку 256 байт верхнього "поверха" кожного символа, потім 256 другого зверху "поверха" і т.д. Це дозволило позбутись множення на висоту символа на кожній ітерації. Але не знаю, чи доцільно це застосовувати у вашій реалізації.

Якщо у вас там тільки цифри, то інтервал в 125 нс (1 "віртуальний" піксель) не має сильно заважати. Тільки ж AVR'івський контролер SPI при CPHA=1 "тягне" останній біт до наступного байта, тобто буде не просто темний проміжок, а "розтягнуті" крайні пікселі. А при CPHA=0 сигнал потрібно інвертувати. Хоча й при використанні USART SPI теж потрібен зовнішній інвертор.

#18 Re: Програмування Arduino » Регістрова змінна » 2025-08-24 14:57:14

MikeM пише:

В SPI мені вдалося звести інтервал між суміжними байтами до 0,125 наносекунди.

Ви не помилились з приставкою? 0,125 наносекунди чи мікро?
Ось щойно перевірив: при затримці між записами в SPDR 17 тактів дані виводяться нормально, інтервал 125 нс. При затримці 16 тактів виводиться нуль. При затримці 15 і менше запис в регістр взагалі ігнорується.

MikeM пише:

А USART в режимі SPI хіба не буде додавати стартові і стопові біти?

Не буде, на то він і SPI-режим.

#19 Re: Програмування Arduino » Регістрова змінна » 2025-08-22 18:47:04

MikeM пише:

Я спробував виводити послідовний код через SPI. Виводить 8 біт за мікросекунду, а потім ще мікросекунду чекає. Чи можна вплинути на цю зайву затримку?

Так покажіть код, яким виводите. Мабуть же там ще якісь інструкції виконуються.
На "звичайному" SPI завжди будуть проміжки в один чи два такта між байтами. Принаймні мені так і не вдалось їх позбутись. Але не ціла мікросекунда, то щось не так в коді.
Щоб отримати безперервний потік, потрібно виводити через USART в режимі SPI. Звісно, вивод буде на TX пін, а не на MOSI.

#20 Re: Програмування Arduino » Регістрова змінна » 2025-08-22 05:56:14

Хм, здається, я здогадуюсь, чому так мало козявок з HDMI. Це ж проприєтарний стандарт. За кожний розʼєм на виробі потрібно ліцензійний збір сплачувати.

#22 Re: Програмування Arduino » Регістрова змінна » 2025-08-21 23:59:18

MikeM пише:

Прийом інформації вже реалізовано - для цього вистачило періоду і тривалості рядкових синхроімпульсів.

Якщо девайс сам обирає коли приймати, тобто є мастером шини, то такий варіант цілком робочий.

MikeM пише:

Наразі триває боротьба за формування відеосигналу в форматі 640*480*60 Гц

Для атмеги є реалізації, наприклад.
Нажаль, свою реалізацію навряд чи вже знайду, грався з цим років 20 тому.
Є цікаві рішення і на інших платформах.

Розглядали інші варіанти? Будь-яка козявка з апаратним HDMI-контролером значно спростила би реалізацію. А якщо потреба відображати саме на VGA, то можна через готовий перехідник.

#23 Re: Програмування Arduino » Регістрова змінна » 2025-08-21 17:38:35

Щодо практичної доцільності - то автору видніше. А щодо ненормальності я би посперечався. Якраз такі задачі дають розуміння нутрощів як конкретної платформи, так і в загальному. І розуміння предметної області. Без такого розуміння тільки скетчі ліпити з готових бібліотек за вказівками AI.
Та й порція ендогенного дофамінчику природнім шляхом - це приємно.

#24 Re: Програмування Arduino » Регістрова змінна » 2025-08-21 08:33:44

jokeer пише:

Хм. Виводити дані через spi, порахувати такти, щоб наступний байт завантажувався зразу після вивантаження- тоді можна або без розривів, або з мінімальними.

Саме так і реалізується.

jokeer пише:

Але проблема- пам'яті не вистачить.

Якщо виводити текст, то багато пам'яті не потрібно: шрифт на флешці лежить. За 16 тактів можна багато чого встигнути smile

#25 Re: Програмування Arduino » Регістрова змінна » 2025-08-21 07:45:41

MikeM пише:

Схоже, що це найкраще пояснення того, що відбувається.

Але приведений вами код в такі інструкції не скомпілиться, бо у вас же пишеться весь регістр PORTB. Компілятор не знає, що з нього потрібен тільки один біт, а решта ігнорується. Хіба що значення після кожного зсуву заздалегідь завантажились в 7 регістрів.
Можливо, компілювався схожий, але дещо відмінний від цього код. Потрібно дивитись дизасемблером, що там відбувається насправді.

Підвал форуму