процедура кодування

Classifying Serialization Formats for Inter-service Communication in Distributed Systems

This study focuses on classifying serialization formats used in inter-service communication (ISC) within distributed systems and exploring their historical development. We have examined key features of humanreadable formats such as XML, JSON, and YAML, binary formats like Protocol Buffers and Apache Avro, and columnar formats such as Apache Parquet and ORC, among others. Our results have indicated a significant shift toward binary formats optimized for speed and compactness in recent years.

Impact of Serialization Format on Inter-Service Latency

This study provides an evaluation of the impact of various serialization formats on inter-service communication performance, with a focus on serialization speed, space efficiency, and latency in environments integrating middleware, which are characteristics of microservice architectures. Through an empirical analysis of a wide range of serialization formats and comparison to the traditional standards, it highlights that the compactness of serialized payloads is more critical in reducing end-to-end latency than the sheer speed of serialization itself.

Удосконалення методів зберігання текстових даних

У дослідженні проаналізовано якісні характеристики повідомлень у месенджері Telegram, використаних як вихідні дані для подальшого аналізу текстового контенту. Здійснено ретельний огляд параметрів цих повідомлень, таких як їх формат, розмір, наявність шумів та швидкодія. Основна мета статті – моделювання оптимального підходу до збереження великого обсягу даних перед важливим етапом аналізу тексту. Під час дослідження детально проаналізовано літературні джерела із цієї тематики.

Beyond JSON: Evaluating Serialization Formats for Space-Efficient Communication

Distributed systems rely on efficient inter-service communication, heavily impacted by data transmission costs. This study investigates alternative serialization formats, like Avro and MessagePack, to reduce data size compared to the common JSON format. We utilize a custom model to comprehensively assess the space efficiency of serialization formats across various data types. Our findings demonstrate that adopting alternative formats achieves a median reduction in serialized data exceeding 30 %.

Програмна модель кодів Ріда-Соломона

Розроблена програма для моделювання завадостійких кодів Ріда-Соломона на основі об’єктно-орієнтованої технології. Вхідними даними для системи є блоки байтів для передачі через канал зв’язку, де в цих блоках можуть статися помилки. Створена програма реалізує коди типу (255,239) та (255,223) для скінченого поля з 256 елементів GF(28) зі стандартними породжуючими багаточленами x8+x4+x3+x2+1 та x8+x7+x2+x+1. Крім того, передбачена можливість у випадку необхідності додати інші типи кодів та багаточлени, які породжують скінченне поле.